- 1 -
1
TRƯỜNG ………………….
KHOA……………………….
----------
Báo cáo tốt nghiệp
Đề tài:
TRÍCH CHN THÔNG TIN TRÊN TẬP VĂN BẢN PHÁP LUT DÙNG K
THUT HC MÁY BÁN GIÁM SÁT DA TRÊN MÔ HÌNH CRFs THEO TIÊU
CHUN K VNG TNG QUÁT
- 2 -
2
LỜI CAM ĐOAN
Tôi xin cam đoan kết quđạt được trong luận văn là sn phm ca riêng
nhân tôi, không sao chép li ca người khác. Trong toàn b ni dung ca lun
văn, những điều được trình y hoc là ca nhân hoặc được tng hp t
nhiu ngun i liu. Tt c các i liu tham khảo đều xut x ng
được trích dn hp pháp. i xin hn toàn chu trách nhim chu mi hình
thc k luận theo quy đnh cho li cam đoan của mình.
Hà Ni, 05/2011
Phm Th Ngân
- 3 -
3
MC LC
LỜI CAM ĐOAN .............................................................................................. 1
MC LC ......................................................................................................... 3
DANH MC HÌNH V..................................................................................... 5
DANH MC BNG BIU................................................................................ 6
KÝ T VIT TT............................................................................................. 7
LI CM ƠN .................................................................................................... 8
LI MỞ ĐU.................................................................................................... 9
CHƯƠNG 1: HC BÁN GIÁM SÁT THEO HÌNH TRƯỜNG NGU
NHIÊN CÓ ĐIỀU KIN.................................................................................. 11
1.1. Phương pháp học máy Trường ngẫu nhiên có điu kin ............................. 11
1.1.1. Khái niệm trường ngu nhiên có điều kin ......................................... 11
1.1.2. Hc máy CRFs ................................................................................... 13
1.1.2.1. Hàm tim năng ca các mô hình CRFs .................................... 13
1.1.2.2. Thut toán gán nhãn cho d liu dạng chui............................ 14
1.1.2.3. Ước lượng tham scho các mô hình CRFs .............................. 15
1.2. Hc máy bán giám sát CRFs ...................................................................... 15
1.2.1. Hc máy bán giám sát......................................................................... 15
1.2.1.1. Hc không có giámt và Hc có giám sát............................. 16
1.2.1.2. Hc máy bán giám sát.............................................................. 18
1.2.1.3. Mt s thut toán hc máy bán giám sát .................................. 19
1.2.2. Sơ bộ v mô hình hc máyn giám sát CRFs ................................... 21
1.3. Kết luận chương 1 ...................................................................................... 22
CHƯƠNG 2: HC MÁY BÁN GIÁM SÁT CRFs THEO TIÊU CHUN K
VNG TNG QUÁT ...................................................................................... 23
2.1. Tiêu chun k vng tng quát .................................................................... 23
2.1.1. Gii thiu sơ bộ .................................................................................. 23
2.1.2. Tiêu chun k vng tng quát............................................................. 24
2.2. Mô hình hc máy bán giám sát CRFs theo tiêu chun k vng tng quát ... 26
- 4 -
4
2.3. Kết luận chương 2 ...................................................................................... 28
CHƯƠNG 3: MỘT HÌNH HC MÁY BÁN GIÁM SÁT CRFs TRÍCH
CHN THÔNG TIN PHÁP LUT TING VIT ......................................... 29
3.1. Trích chn thông tin tvăn bản pháp lut tiếng Vit ................................. 29
3.1.1. Mt số đặc trưng v min d liu văn bản pháp lut tiếng Vit........... 29
3.1.2. Bài toán trích chn thông tin văn bản pháp lut tiếng Vit.................. 31
3.2. Mt mô hình hc máy n giám t CRFs trích chn thông tin pháp lut
tiếng Vit ...................................................................................................... 31
3.2.1. Mt s phân tích................................................................................. 31
3.2.2. Mô hình đề ngh................................................................................. 32
3.2.3. La chn thuc tính............................................................................ 36
3.2.4. Cách đánh giá ..................................................................................... 36
3.3. Kết luận chương 3 ...................................................................................... 37
CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ ............................................. 38
4.1. Mô hình thc nghim ................................................................................ 38
4.1.1. D liu thc nghim........................................................................... 38
4.1.2. B công c Mallet .............................................................................. 38
4.2. Thc nghim và đánh giá .......................................................................... 38
4.2.1. Môi trường thc nghim..................................................................... 38
4.2.2. Mô t quy trình thc nghim............................................................... 38
4.2.3. Kết qu thc nghim........................................................................... 39
4.2.4. Đánh giá ............................................................................................. 40
4.3. Kết luận cơng 4 ..................................................................................... 43
KT LUN...................................................................................................... 45
TÀI LIU THAM KHO................................................................................ 47
- 5 -
5
DANH MC HÌNH V
Hình 1. Đồ thị hưng mô tả CRFs ....................................................... 12
Hình 2. Mt bước trong thut toán Viterbi cải tiến................................... 14
Hình 3/4. Mô hình đề xut gii quyết bài toán.......................................... 34
Hình 5. Tp các ràng buc (Constraint file) ............................................. 35
Hình 6. Kết qu nhóm thc nghim 1 ....................................................... 40
Hình 7. Kết qu nhóm thc nghim 2 ....................................................... 40
Hình 8. Kết qu nhóm thc nghim 3 ....................................................... 41
Hình 9. Kết qu nhóm thc nghim 4 ....................................................... 42
Hình 10. Kết qu nhóm thc nghim 5 ..................................................... 43