i
Bài Lun
Đề Tài:
Phân tích b cc và nhn dng
nh công văn tiếng Vit
ii
Để hoàn thành đề tài này và có kiến thc như ngày hôm nay,
đầu tiên chúng em xin gi li cm ơn đến Ban Giám Hiu cùng
toàn th Thy Cô Khoa Công Ngh Thông Tin – Trường Đại Hc
Nông Lâm TP.HCM đã tn tình ging dy, truyn đạt kiến thc
cũng như nhng kinh nghim quý báu cho chúng em trong sut
quá trình hc tp và nghiên cu ti trường.
Chúng em cũng chân thành cm ơn thy Nguyn Đức Thành
đã tn tình hướng dn và quan tâm, động viên chúng em trong quá
trình thc hin đề tài.
Chúng em cũng bày t lòng biết ơn sâu sc đến nhng người
thân trong gia đình, bn bè đã động viên và to mi điu kin giúp
chúng em trong quá trình hc tp cũng như trong cuc sng.
Mc dù chúng em đã c gng hoàn thành tt đề tài nhưng
cũng không th tránh khi nhng sai sót nht định, rt mong được
s thông cm và chia s cùng quý Thy Cô và bn bè.
Chúng em xin gi li chúc sc khe và thành đạt ti tt c
quý thy cô cùng các bn.
Nhóm sinh viên thc hin
Đại Bình
Nguyn Th Tú Mi
Nguyn Thùy Giang
LI C
MƠN
iii
MC LC
Trang
DANH MC CÁC HÌNH .............................................................................................. VII
DANH MC CÁC BNG .............................................................................................. XI
DANH SÁCH CH VIT TT .................................................................................... XII
TÓM TT ..................................................................................................................... XIII
CHƯƠNG 1: GII THIU ................................................................................................ 1
CHƯƠNG 2: NH PHÂN HÓA ........................................................................................ 5
2.1. ĐẶT VN ĐỀ ..................................................................................................... 5
2.2. PHƯƠNG PHÁP OTSU ...................................................................................... 5
CHƯƠNG 3: CHNH NGHIÊNG NH VĂN BN ........................................................ 8
3.1. S DNG CÁC PHÉP BIN ĐỔI MORPHOLOGY TRONG ƯỚC LƯỢNG
NGHIÊNG VĂN BN ........................................................................................ 8
3.1.1. ĐẶT VN ĐỀ ............................................................................................ 8
3.1.2. MT S HƯỚNG TIP CN HIN CÓ: ................................................. 9
3.1.3. MÔ T PHƯƠNG PHÁP. ....................................................................... 15
3.1.3.1. BƯỚC TIN X....................................................................... 16
3.1.3.2. ƯỚC LƯỢNG THÔ ......................................................................... 16
3.1.3.3. ÁP DNG CÁC PHÉP BIN ĐỔI MORPHOLOGY .................... 19
3.1.3.4. ƯỚC LƯỢNG TINH ........................................................................ 25
3.1.4. KT QU THC NGHIM .................................................................... 28
3.2. PHƯƠNG PHÁP QUAY NH VĂN BN NH PHÂN .................................. 33
3.2.1. ĐẶT VN ĐỀ .......................................................................................... 33
3.2.2. MÔ T PHƯƠNG PHÁP ........................................................................ 34
3.2.2.1. TO VÀ LƯU TR CÁC PMPs..................................................... 34
iv
3.2.2.2. CHIA NH THÀNH CÁC BLOCK ................................................ 35
3.2.2.3. THC HIN QUAY NH .............................................................. 36
3.2.3. KT LUN ............................................................................................... 38
3.3. TNG KT ....................................................................................................... 38
CHƯƠNG 4: TÁCH KHI VĂN BN .......................................................................... 40
4.1. ĐẶT VN ĐỀ: .................................................................................................. 40
4.2. MT S PHƯƠNG PHÁP TÁCH KHI HIN CÓ ........................................ 43
4.3. T PHƯƠNG PHÁP ................................................................................. 45
4.3.1. CH KHI THEO CHIU NGANG .................................................... 45
4.3.2. CH KHI THEO CHIU DC .......................................................... 51
4.3.3. CH KHI THEO CHIU NGANG LN 2 ........................................ 51
4.4. KT LUN NHN XÉT T KT QU THC NGHIM: ..................... 53
CHƯƠNG 5:TÁCH DÒNG VĂN BN ......................................................................... 55
5.1. ĐẶT VN ĐỀ ................................................................................................... 55
5.2. T PHƯƠNG PHÁP ................................................................................. 55
5.2.1. DÙNG CÁC PHÉP BIN ĐỔI MORPHOLOGY ĐỂ TÔ LEM DÒNG
VĂN BN ................................................................................................ 55
5.2.2. LY LƯC ĐỒ CHIU ĐỐI VI MI KHI VĂN BN THEO
TRC OY ................................................................................................. 57
5.2.3. XÁC ĐỊNH DÒNG VĂN BN TRONG MI KHI ............................. 59
5.3. KT LUN ....................................................................................................... 60
CHƯƠNG 6: TÁCH T VĂN BN .............................................................................. 62
6.1. ĐẶT VN ĐỀ ................................................................................................... 62
6.2. MT S HƯỚNG TIP CN KHÁC .............................................................. 62
6.3. T PHƯƠNG PHÁP ................................................................................. 63
6.3.1. NI DU VÀ KÝ T.............................................................................. 63
6.3.2. NI KÝ T TRONG T ......................................................................... 65
v
6.4. TNG KT ....................................................................................................... 67
CHƯƠNG 7: TÁCH KÍ T ............................................................................................ 68
7.1. ĐẶT VN ĐỀ ................................................................................................... 68
7.2. T PHƯƠNG PHÁP ................................................................................. 69
7.3. KT LUN MT S KT QU THC NGHIM .................................. 70
CHƯƠNG 8: XÂY DNG GROUND TRUTH VÀ CÔNG C ĐÁNH GIÁ ĐỘ
CHÍNH XÁC CA THUT TOÁN PHÂN VÙNG VĂN BN ..................... 71
8.1. XÂY DNG GROUND TRUTH CÔNG C ĐÁNH GIÁ ĐỘ CHÍNH
XÁC CA THUT TOÁN PHÂN VÙNG VĂN BN .................................... 71
8.2. KT XUT KT QU ..................................................................................... 76
8.2.1. KT XUT KT QU DƯỚI DNG FILE XML ................................. 77
8.2.2. KT XUT KT QU DƯỚI DNG FILE MS WORD ....................... 80
CHƯƠNG 9: NG DNG MNG NEURAL NHÂN TO TRONG NHN DNG
KÍ T IN TING VIT .................................................................................... 83
9.1. ĐẶT VN ĐỀ ................................................................................................... 83
9.2. CƠ S THUYT MNG NEURAL NHÂN TO GII THUT
LAN TRUYN NGƯỢC .................................................................................. 84
9.2.1. NHNG THÀNH PHN CHÍNH CA MT MNG NEURAL ......... 85
9.2.2. MÔ HÌNH MNG NEURAL NHÂN TO ............................................. 87
9.2.3. CÁC HÀM KÍCH HOT THƯỜNG ĐƯỢC DÙNG .............................. 87
9.2.4. CU TRÚC MNG FEED-FORWARD ................................................. 88
9.2.5. GII THUT LAN TRUYN NGƯỢC (BACK – PROPAGATION
ALGORITHM) ......................................................................................... 89
9.3. T PHƯƠNG PHÁP ................................................................................. 94
CHƯƠNG 10: TNG KT ............................................................................................. 96
TÀI LIU THAM KHO ............................................................................................... 99