intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn: Phương pháp thêm dấu tiếng việt vào văn bản tiếng việt không dấu

Chia sẻ: Gacon | Ngày: | Loại File: PDF | Số trang:0

122
lượt xem
19
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Chữ tiếng việt của chúng ta cố một đặc điểm rất hay là có sự xuất hiện của các dấu thanh cũng như dấu của các ký tự, việc này giúp cho tiếng Việt thêm thanh thêm điệu. Tuy nhiên cũng chính việc thêm thanh thêm điệu đó lamg cho việc gõ tiếng Việt tốn nhiều thời gian hơn. 1 vấn đề khác khi sử dụng internet trở nên thông dụng, 1 tiện ích được mọi người ưa chuộng là dịch vụ E-mail, nhưng hầu hết các server đều chưa hỗ trợ tiếng Việt...

Chủ đề:
Lưu

Nội dung Text: Luận văn: Phương pháp thêm dấu tiếng việt vào văn bản tiếng việt không dấu

  1. TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN CÔNG NGH TRI TH C PHAN QU C LÂN PH NG PHÁP THÊM D U TI NG VI T VÀO V N B N TI NG VI T KHÔNG D U KHOÁ LU N C NHÂN TIN H C TP. HCM, N M 2005
  2. TR NG I H C KHOA H C T NHIÊN KHOA CÔNG NGH THÔNG TIN MÔN CÔNG NGH TRI TH C PHAN QU C LÂN – 0112267 PH NG PHÁP THÊM D U TI NG VI T VÀO V N B N TI NG VI T KHÔNG D U KHOÁ LU N C NHÂN TIN H C GIÁO VIÊN H NG D N Th.S PH M PH M TUY T TRINH NIÊN KHÓA 2001 – 2005 1
  3. ic m n i u tiên, em xin chân thành c m n cô Ph m Ph m Tuy t Trinh, cô ã tr c ti p h ng d n và t o u ki n cho em nghiên c u và hoàn thành lu n v n này. Em c ng xin chân thành c m n th y inh n, th y ã h tr , giúp em r t nhi u trong quá trình th c hi n. Và em c ng xin c m n t t c các th y cô trong khoa Công ngh thông tin ã t n tình ch b o và giúp em trong su t quá trình h c t p trong tr ng. Con xin chân thành c m n ba m , ông bà, anh em và ng i thân trong gia ình ãt om i u ki n t t nh t cho con h c t p và ng viên, khích l con trong quá trình th c hi n lu n v n. Và cu i cùng, tôi xin g i l i c m n n t t c b n bè, c bi t là anh Toàn, b n Sinh, b n Kh ng …, nh ng ng i ã h tr và giúp tôi hoàn thi n lu n v n này. c dù em ã c g ng hoàn thành lu n v n trong ph m vi và kh n ng cho phép nh ng ch c ch n s không tránh kh i nh ng thi u sót. Em kính mong nh n cs m thông và t n tình ch b o c a quý Th y Cô và các b n. TP. H Chí Minh, tháng 7 n m 2005 Phan Qu c Lân – 0112267 2
  4. NH N XÉT C A GIÁO VIÊN H NG D N ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ Thành ph H Chí Minh, tháng 07 n m 2005 Giáo viên h ng d n Th.S Ph m Ph m T uy t Trinh 3
  5. NH N XÉT C A GIÁO VIÊN PH N BI N ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ ___________________________________________________ Thành ph H Chí Minh, tháng 07 n m 2005 Giáo viên ph n bi n TS. inh n 4
  6. I NÓI U Ch vi t ti ng Vi t c a chúng ta có 1 c m r t hay là có s xu t hi n c a các u thanh c ng nh d u c a các ký t . u này giúp cho ti ng Vi t “thêm thanh, thêm u”. Tuy nhiên, c ng chính vi c “thêm thanh, thêm u” ó làm cho vi c gõ ti ng Vi t tr nên t n nhi u th i gian h n. 1 v n khác, khi vi c s d ng Internet tr nên thông d ng, 1 ti n ích c m i ng i a chu ng là d ch v Email. Nh ng, cho n hi n nay, h u h t các mail server v n ch a h tr t t ti ng Vi t, do ó, tình tr ng các lá mail trên m ng h u nh không có d u. Vi c phát tri n 1 công c giúp thêm d u ti ng Vi t vào v n b n không d u là vi c r t c n thi t và thú v . tài này h ng n vi c gi i quy t bài toán thêm d u ti ng Vi t theo m t ng m i, do ó, ch ng trình không chú tr ng chuyên sâu vào l nh v c nào. Vi c thêm ch c n ng h tr các l nh v c chuyên sâu khác không nh h ng nhi u nc u trúc c a mô hình mà ch ng trình áp d ng. Lu n v n c t ch c thành 5 ch ng v i n i dung nh sau : § Ch ng 1 gi i thi u t ng quan v bài toán Thêm d u ti ng Vi t vào v n b n không d u, và các công trình ã có liên quan n tài. § Ch ng 2 gi i thi u các c s lý thuy t _ tin h c c n s d ng. § Ch ng 3 nh n xét các mô hình ã có tr c ây, và a ra mô hình cài t chính. § Ch ng 4 c th hóa mô hình cài t. § Ch ng 5 t ng k t và ra h ng phát tri n .
  7. CL C Ch ng 1. NG QUAN....................................................................9 1.1. Gi i thi u v bài toán Thêm d u ti ng Vi t vào v n b n không d u .......10 1.1.1. Phát bi u bài toán.........................................................................................10 1.1.2. c m .......................................................................................................10 1.1.3. ng gi i quy t ..........................................................................................11 1.2. Gi i thi u các công trình ã có ..................................................................11 1.2.1. AMPad..........................................................................................................11 1.2.2. VietPad .........................................................................................................12 1.2.3. www.EasyVn.com.........................................................................................13 1.2.4. VnMark ........................................................................................................14 Ch ng 2. S LÝ THUY T TIN H C....................................15 2.1. Lý thuy t v ngôn ng h c .........................................................................16 2.1.1. Âm ti t (còn g i là “ti ng”) ..........................................................................16 2.1.1.1. nh ngh a và c m âm ti t ti ng Vi t ..............................................16 2.1.1.2. Thanh là thành ph n c a âm ti t ti ng Vi t .............................................16 2.1.1.3. T i sao l i ph i dùng d u thanh ? ............................................................17 2.1.2. ..................................................................................................................18 2.1.2.1. Các quan ni m v t ...............................................................................18 2.1.2.2. Tiêu chí nh n di n “t ” ti ng Vi t...........................................................18 2.1.2.2.1. Các tiêu chu n v hình th c .................................................................19 2.1.2.2.2. Các tiêu chu n v n i dung ..................................................................19 2.2. Tách t ........................................................................................................20 2.2.1. Kh p t i a (LRMM – Left Right Max Matching).....................................21 2.2.2. Mô hình m ng WFST và m ng n -ron .......................................................22 2.3. Tách câu......................................................................................................22 2.3.1. Tách câu b ng Heristics. ..............................................................................23 2.3.1.1. X lý d u ch m. .....................................................................................23 2.3.1.2. X lý d u ch m trong ngo c. ..................................................................24 Ch ng 3.MÔ HÌNH CÀI T ......................................................25 3.1. Các mô hình thêm d u ã c s d ng...................................................26 3.1.1. VietPad .........................................................................................................26 3.1.1.1. Mô hình thêm d u ti ng Vi t ..................................................................26 3.1.1.1.1. Ti n x lý ............................................................................................26 3.1.1.1.2. Tách token...........................................................................................27 3.1.1.1.3. L y ra các t không d u, chuy n thành t có d u .................................27 3.1.2. VnMark ........................................................................................................28 6
  8. 3.1.2.1. Mô hình thêm d u ti ng Vi t ..................................................................28 3.1.2.1.1. Ti n x lý ............................................................................................30 3.1.2.1.2. Tách câu ..............................................................................................30 3.1.2.1.3. Tìm các kh n ng ánh d u c a t , câu ................................................30 3.1.2.2. Mô hình hu n luy n ................................................................................31 3.2. Mô hình xu t..........................................................................................32 3.2.1. Mô hình.........................................................................................................32 3.2.1.1. Tách câu .................................................................................................33 3.2.1.2. Tách t b ng ph ng pháp LRMM.........................................................34 3.2.1.3. Ch n t thích h p ...................................................................................34 3.2.2. Mô hình hu n luy n .....................................................................................36 3.2.2.1. Th ng kê t n su t xu t hi n c a t ..........................................................36 3.2.2.1.1. Xây d ng kho ng li u.........................................................................36 3.2.2.1.2. Th ng kê t n su t xu t hi n c a t .......................................................37 3.2.2.1.3. T o t n chuy n i ........................................................................38 3.2.2.2. Trích xu t các c m t th ng s d ng ....................................................39 3.2.3. So sánh mô hình này v i 2 mô hình trên .....................................................41 Ch ng 4.CÀI T TH NGHI M.............................................43 4.1. Th ng kê t n s xu t hi n c a t ...............................................................44 4.1.1. Xây d ng kho ng li u text t báo n t ..................................................44 4.1.2. Tách câu........................................................................................................48 4.1.3. Tách t và th ng kê......................................................................................50 4.2. o t p tin t n chính............................................................................52 4.3. o t p tin t n c m t .........................................................................55 4.3.1. o kho d li u tinh gi n m i ......................................................................55 4.3.2. o t p tin t n c m t ...........................................................................58 4.4. Ch ng trình chính....................................................................................58 4.4.1. Ch ng trình VietEditor..............................................................................59 4.4.2. Ch ng trình thêm d u qua Clipboard.......................................................60 4.5. Th nghi m ................................................................................................62 Ch ng 5. T QU , H NG PHÁT TRI N .............................63 5.1. n ch và h ng phát tri n .....................................................................64 5.2. t lu n ......................................................................................................64 Ph l c : C u trúc kho ng li u ......................................................67 7
  9. DANH M C HÌNH Hình 1.2.1-1 : Thêm d u ti ng Vi t t ng b ng AMPad ......................................................12 Hình 1.2.2-2 : Gõ ti ng Vi t không d u trên VietPad .............................................................12 Hình 1.2.2-3 : V n b n sau khi th c hi n ch c n ng thêm d u ti ng Vi t c a VietPad ...........13 Hình 1.2.3-4 : Gõ ti ng Vi t không d u trên EasyVn..............................................................14 Hình 1.2.3-5 : V n b n sau khi t ng thêm d u trên EasyVn ..............................................14 Hình 1.2.4-6 : S k t c u âm ti ng Vi t .............................................................................17 Hình 3.1.1-7 : L u th c hi n c a mô hình ng d ng trong VietPad...................................26 Hình 3.1.2-8 : L u th c hi n c a mô hình n-gram ............................................................29 Hình 3.2-9: L u th c hi n c a mô hình xu t ................................................................33 Hình 3.2-10 : T p tin m u sau khi th ng kê t n su t t ..........................................................38 Hình 3.2-11 : Trích t p tin TuDienChinh.txt ..........................................................................39 Hình 3.2-12 : Trích t p tin CumTu.txt....................................................................................41 Hình 4.1.1-13: Giao di n ch ng trình HTML2TXT ..............................................................44 Hình 4.1.1-14: C u hình c a ch ng trình HTML2TXT.........................................................45 Hình 4.1.1-15 : M t trang báo thanh niên..............................................................................47 Hình 4.1.1-16 : li u c tách t trang báo Thanh niên ...................................................48 Hình 4.1.2-17: Giao di n ch ng trình Tách Câu ..................................................................49 Hình 4.1.2-18: T vi t t t cung c p cho ch ng trình Tách Câu............................................49 Hình 4.1.2-19: N i dung file k t xu t c a ch ng trình Tách Câu .........................................50 Hình 4.1.3-20: Giao di n module tách t ...............................................................................51 Hình4.1.3-21: N i dung t p tin th m c ngu n ......................................................................51 Hình 4.1.3-22: N i dung t p tin t n .................................................................................52 Hình 4.1.3-23: N i dung t p tin k t qu .................................................................................52 Hình 4.1.3-24: Giao di n ch ng trình t o t n chính .......................................................53 Hình 4.1.3-25 : Trích 1 ph n TuDienChinh.txt .......................................................................54 Hình 4.1.3-26 : Trích 1 ph n TuDienPhanLop.txt .................................................................54 Hình 4.1.3-27: Trích 1 ph n KhoCau.txt ................................................................................55 Hình 4.3.1-28: Giao di n ch ng trình t o kho d li u tinh gi n ...........................................56 Hình 4.3.1-29 : Trích 1 ph n th m c k t xu t .......................................................................57 Hình 4.3.1-30 : Th m c con _a trong th m c k t xu t.........................................................57 Hình 4.3.2-31: Giao di n ch ng trình t o t p tin c m t .....................................................58 Hình 4.4.1-32: Giao di n ch ng trình chính VietEditor .......................................................59 Hình 4.4.2-33: Giao di n ch ng trình chính thêm d u Clipboard ........................................60 Hình 4.4.2-34: Test ch ng trình thêm d u Clipboard ...........................................................61 Hình 5.2-35 : T p tin kho ng li u m u .................................................................................69 8
  10. NG QUAN Ch ng 1.
  11. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u 1.1. Gi i thi u v bài toán Thêm d u ti ng Vi t vào n b n không d u 1.1.1. Phát bi u bài toán Bài toán có th c phát bi u nh sau : Cho m t v n b n ti ng Vi t không u. Chuy n v n b n không d u này thành có d u v i chính xác cao. Ch s d ng t n t và kho ng li u thô làm u vào. Khái ni m t ây là “t t n” – t c là các t n, t ghép và c m t c l u trong t n. Ch x lý các v n b n ti ng Vi t có mã Unicode. 1.1.2. c m Ch vi t ti ng Vi t có 1 c m r t hay là s xu t hi n c a các d u thanh ng nh d u c a các ký t . Vi c có d u thanh và d u c a ký t này làm phong phú thêm cho ngôn t ti ng Vi t, và c ng góp ph n t ng bi u c m c a ti n g Vi t. u thanh là 1 thành ph n “b t kh phân” trong âm ti t ti ng Vi t [8]. Khi lo i b d u thanh, vi c hi u ngh a c a t , g m 1 hay nhi u âm ti t k t h p v i nhau, tr nên khó kh n và d gây hi u l m. thêm d u, tr c tiên, ta c n ph i xác nh ranh gi i t . Bài toán xác nh ranh gi i t i v i v n b n ti ng Vi t có d u ã là 1 vi c th thách, thì khi không có d u, vi c nh n di n ranh gi i t càng tr nên khó kh n h n. V n này l i càng khó kh n, khi ranh gi i t trong ti ng Vi t c ng nh 1 s ngôn ng Châu Á khác, m t t chính t có th không t ng ng v i m t “t ” trên v n n. i v i các th ti ng Châu Âu, ta có th d dàng nh n ra m t t , do các t c phân cách b i kho ng tr ng. u này l i không úng v i ti ng Vi t. Trong ti ng Vi t, các ti ng _ hay còn g i là âm ti t _ c phân cách b i kho ng tr ng, ch không ph i t . 10
  12. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Sau khi ã nh n di n c ranh gi i t , ta c n ph i xác nh cho úng t có u nào có d ng th hi n không d u nh v y. Vi c xác nh này c ng gây nhi u khó kh n, khi 1 t không d u có th có nhi u t có d u t ng ng v i nó. Ví d 1-1 : T không d u “toi” có 3 t có d u t ng ng là “tôi”, “t i” và “t i”. Do ó, sau khi ã gi i quy t xong bài toán tách t ti ng Vi t không d u, ta n ph i gi i quy t thêm bài toán xác nh t có d u thích h p v i t không d u ó. ây chính là 2 bài toán c n gi i quy t chính c a mô hình. 1.1.3. ng gi i quy t i v i tách t có d u, có nhi u mô hình c s d ng và t k t qu cao nh MM (Maximum Matching : forward / backward hay còn g i là LRMM: Left Right); gi i thu t h c c i bi n TBL; m ng chuy n d ch tr ng thái h u h n có tr ng s WFST (Weighted finite-state Transducer); gi i thu t d a trên nén (compression) [1] …. H ng gi i quy t c xu t là s d ng ph ng pháp tách t LRMM [1][7] k t h p v i mô hình Bigram ã gi i quy t khá hi u qu 2 n c a bài toán này. Ph ng pháp ch m i c áp d ng cho mô hình thêm u offine, nh ng có th c cài t gán d u online. 1.2. Gi i thi u các công trình ã có 1.2.1. AMPad AMPad [12] (tên version c và thông d ng v i m i ng i là AutoMark) a tác gi Tr n Tri t Tâm là s n ph m u tiên nghiên c u v l nh v c này. Ch ng trình ã c nhi u ng i bi t n và c s d ng r ng rãi. u này cho th y vi c phát tri n ng d ng hoàn thi n h n n a v thêm d u ti ng Vi t là có nhu c u, và nhu c u này s ngày càng t ng cao. Ch ng trình AMPad có 11
  13. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u m hay là vi c áp d ng mô hình x lý thêm d u ch online, t o s tr c quan, thân thi n cho ng i s d ng. Hình 1.2.1-1 : Thêm d u ti ng Vi t t ng b ng AMPad 1.2.2. VietPad Vietpad [11] là trình so n th o h tr ti ng Vi t Unicode, c phát tri n i Quân Nguy n và nhóm phát tri n trên http://vietpad.sourceforge.net. Ngoài ch c n ng thêm d u t ng offline mà lu n v n ang nghiên c u, VietPad còn là 1 trình so n th o ti ng Vi t h tr r t t t Unicode và là mã ngu n m . Hình 1.2.2-2 : Gõ ti ng Vi t không d u trên VietPad 12
  14. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Hình 1.2.2-3 : V n b n sau khi th c hi n ch c n ng thêm d u ti ng Vi t c a VietPad 1.2.3. www.EasyVn.com Trang web www.easyvn.com [10] cung c p d ch v email n t mi n phí trên m ng, v i s h tr ng i dùng r t t t v ngôn ng Vi t. 1 ch c n ng n i t c a www.easyvn.com là : sau khi so n th o xong b c mail, ng i dùng có th ch n ch c n ng Thêm d u ti ng Vi t bi n v n b n không d u thành có u. Do ây là d ch v c cung c p và thu phí trên NET (cho s d ng th trong 2 tháng), mô hình thêm d u t ng c a www.easyvn.com c gi kín. 13
  15. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Hình 1.2.3-4 : Gõ ti ng Vi t không d u trên EasyVn Hình 1.2.3-5 : V n b n sau khi t ng thêm d u trên EasyVn 1.2.4. VnMark VnMark [2] c tác gi Nguy n V n Toàn phát tri n. Do tác gi ã làm th t l c ch ng trình, do ó, không có hình nh minh ho ch ng trình. 14
  16. S LÝ THUY T Ch ng 2. TIN H C
  17. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u 2.1. Lý thuy t v ngôn ng h c 2.1.1. Âm ti t (còn g i là “ti ng”) 2.1.1.1. nh ngh a và c m âm ti t ti ng Vi t “Ti ng” là “ n v c b n” trong ti ng Vi t [1]. M t “ti ng” trong ti ng Vi t c nói lên là m t n v ng âm, và c ng là m t n v ng pháp. t “ti ng” là m t n v phát ngôn, và là m t n v c a l i nói t o ra nh ng k t c u l i nói trong ho t ng nói n ng giao ti p. c tính này c a ti ng chính là m t tính cách lo i hình c a ti ng Vi t, trong ó m i nv phát âm trùng khít v i n v ng pháp (hình v , và t ). Khi xét trên bình di n ng âm, ti ng là m t n v c a ng âm, t c là m t âm ti t [9]. Vi c nh n di n “ti ng” i v i ng i Vi t là u quá d dàng, t nhiên i v i m i ng i mà không c n m t trình ngôn ng gì cao, vì : trong l i nói (m t ng âm), m i “ti ng” bao gi c ng phát ra m t h i, nghe thành m t ti ng, và có mang m t thanh u nh t u; còn trong ch vi t (m t chính ), m i ti ng bao gi c ng c vi t r i thành t ng ch (ng n cách b ng kho ng tr ng hay các d u ng t). n v “ti ng” i v i ng i Vi t là m t n v t nhiên, khái ni m “ti ng” ã có t lâu và c ng i b n ng s ng nó tr c khi hi u và s d ng khái ni m “t ”. Ví d 2-1: Câu “Cái bàn này hình bán nguy t” có 6 ti ng 2.1.1.2. Thanh là thành ph n c a âm ti t ti ng Vi t Khi phát âm ti ng Vi t, chúng ta phát âm t ng n v l i nói c t r i nhau, i là âm ti t. Khi phát âm ch m m t â m ti t, có th nh n th y khá rõ là m i âm ti t u có th k t h p nhi u nh t là ba n v phát âm : âm u + âm chính + âm cu i. Ba thành ph n trên g m nh ng âm v xu t hi n t ng i theo th t tr c sau, nên g i là nh ng âm v tuy n tính. 16
  18. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u Ngoài ra, m i âm ti t c nh m t b c cao th p, g i là thanh u. Trong l i nói, m i âm ti t ti ng Vi t u mang m t thanh. Thanh này xu t hi n l p t c khi âm ti t c phát ra, cho nên có th nói r ng thanh là m t thành ph n b t kh phân c a âm ti t. Thanh là thành ph n âm v phi tuy n tính c a m t âm ti t ti ng Vi t. Thanh là m t s c thái c a âm thanh các âm ti t, qua ó khi phát âm s nh b c cao th p khác nhau c a m i nv c a chu i l i nói. Có sáu thanh làm tiêu chu n nh b c cao th p khác nhau, th ng g i là ngang, h i, s c, huy n, ngã, n ng. Nh v y thì m i âm ti t ti ng Vi t y có t i a b n n v c u thành. i thi u thì m i âm ti t c ng ph i có hai thành ph n : âm chính + thanh. Hình 1.2.4-6 : S k t c u âm ti ng Vi t 2.1.1.3. i sao l i ph i dùng d u thanh ? Các ngôn ng dùng b ng ch cái Latin không dùng thêm kí hi u ch thanh, mà ch ghi l i các âm v tuy n tính b ng các v là con ch . H th ng ch vi t kh i vuông nh ch Hán và ch Nôm c ng không có kí hi u ch thanh. Nh ng tr ng h p ch qu c ng có khác. Khi dùng b ng ch cái Latin, các v con ch ch a phân bi t ý ngh a m t t c vi t ra, vì có n sáu thanh ph i phân bi t. Ðã ành thanh ch là y u t ng âm không thu c v thành ph n â m v tuy n tính, nh ng thanh ti ng Vi t không h n ch là m t y u t ngôn u mang tính cách hoa m cho âm ti t, mà là m t thành ph n không th thi u c khi phát âm m t âm ti t. Nói cách khác, âm ti t ti ng Vi t ch a hoàn ch nh khi ch a c nh thanh. Có l các nhà sáng ch ra ch vi t theo b ng ch cái Latin mà ta th ng g i quen là "ch qu c ng " 17
  19. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u ã hi u r t rõ tính cách b t kh phân c a thanh i v i âm ti t ti ng Vi t, cho nên các v ã dùng n nh ng kí hi u c h th các b c thanh t ng ng. Và ây c ng là c m n i b t c a ti ng Vi t. 2.1.2. 2.1.2.1. Các quan ni m v t Có 1 s nh ngh a n hình v t nh sau [1] : - Theo L.Bloomfield, thì t là t hình thái t do nh nh . - Theo Solncev thì là n v ngôn ng có tính hai m t: âm và ngh a. có kh n ng c l p v cú pháp khi s d ng trong l . - Theo B.Golovin, thì t là n v nh nh t có ngh a c a ngôn ng , c n d ng c l p, tái hi n t do trong l i nói xây d ng nên câu . ây ng chính là nh ngh a mà trong ngôn ng h c ic ng hay s d ng. Trong n i dung lu n v n này, ta quan tâm t i 3 thu t ng trong ngôn ng ic ng nh n di n t : 1. ng âm : ó là nh ng nv c th ng nh t v i hi n t ng ng âm nào ó. i v i ti ng Vi t, ó chính là nh ng âm ti t, hay còn g i là “ti ng”, “ti ng m t”. 2. chính t : ó là nh ng kho ng cách gi a 2 ch trên v n t , t c là nh ng nv c vi t li n thành kh i, i v i ti ng Vi t, ó chính là “ch ” 3. t n h c : ó là n v mà c n c vào c m ý ngh a c a nó ph i x p riêng trong t n. 2.1.2.2. Tiêu chí nh n di n “t ” ti ng Vi t r t nhi u quan ni m c ng nh các nh ngh a v “t ti ng Vi t”, ta có th rút ra tiêu chu n mà các nhà Vi t ng h c ã d a vào ó khi nh n di n t 18
  20. Lu n v n t t nghi p : Ph ng pháp thêm d u vào v n b n ti ng Vi t không d u ti ng Vi t [3]. Các tiêu chu n này chung qui ta có th phân thành : các tiêu chu n v hình th c và các tiêu chu n v n i dung. 2.1.2.2.1. Các tiêu chu n v hình th c Tính c nh : tính v ng ch c v c u t o, không th chêm – xen c Tính c l p : các nhà Vi t ng h c hay dùng tiêu chu n tính cl p phân bi t t ( n v có ngh a và c l p) v i hình v ( n v có ngh a và không c l p). Tính c l p còn c g i là kh n ng k t h p (t do – h n ch ) Tính t lo i và quan h cú pháp : trong ng /câu, t m nh n nh ng ch c n ng cú pháp nh t nh, nên m i t u ph i mang m t t lo i nào ó, còn hình v thì không có tính ch t t lo i. Quan h gi a các t là quan h cú pháp, còn quan h gi a các hình v c a t không ph i là quan h cú pháp. 2.1.2.2.2. Các tiêu chu n v n i dung Ch c n ng nh danh : ch c n ng này c dùng xác nh t cách c a (t th c), coi ó là c tr ng phân bi t gi a “t ” v i “hình v ” Bi u th khái ni m : vì t v i khái ni m không ph i là m t: có nh ng khái ni m c n bi u th b ng nhi u t , và có nh ng t không bi u th khái ni m. Ý ngh a bi u ni m : vì ý ngh a c a t và khái ni m không trùng nhau, vì y, ng i ta c n phân bi t ý ngh a t v ng và ý ngh a ng pháp. Hoàn ch nh v ngh a : ây là tiêu chu n quan tr ng, c a s các nhà Vi t ng h c ch p nh n trong vi c xác nh t cách c a t . Tiêu chu n này liên quan n tính thành ng và tính võ oán. 19
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2