
Khoa CNTT - ÐH KHTN TP.HCM
Khoa CNTT - ÐH KHTN TP.HCM
`
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN CÔNG NGHỆ TRI THỨC
BÙI THANH HUY - 9912567
LÊ PHƯƠNG QUANG - 9912653
NGHIÊN CỨU VÀ CÀI ĐẶT
BỘ GÁN NHÃN TỪ LOẠI
CHO SONG NGỮ ANH-VIỆT
LUẬN VĂN CỬ NHÂN TIN HỌC
GIÁO VIÊN HƯỚNG DẪN
GS.TSKH HOÀNG KIẾM
NIÊN KHÓA 1999 - 2003

Khoa CNTT - ÐH KHTN TP.HCM
Khoa CNTT - ÐH KHTN TP.HCM
`
Nhận xét của giáo viên hướng dẫn
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
TP. HồChí Minh, ngày…. tháng ….năm 2003
Giáo viên hướng dẫn
GS.TSKH Hoàng Kiếm

Khoa CNTT - ÐH KHTN TP.HCM
Khoa CNTT - ÐH KHTN TP.HCM
`
Nhận xét của giáo viên phảnbiện
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
….…………………………………………………………………………………………………………
TP. HồChí Minh, ngày…. tháng ….năm 2003
Giáo viên phản biện

Khoa CNTT - ÐH KHTN TP.HCM
Khoa CNTT - ÐH KHTN TP.HCM
`
Đầu tiên, chúng em xin chân thành cảmơn thầy giáo
hướng dẫn, GS.TSKH Hoàng Kiếm, người đã tận tình
hướng dẫn bọn em trong suốt quá trình làm luận văn. Đồng
thời, chúng em xin gửi lời cảmơnđến các thầy cô trong
khoa Công Nghệ Thông Tin trường Đại họcKhoaHọcTự
Nhiên đã truyền đạt rất nhiều kiến thức quý báu cho chúng
em.
Chúng em cũng muốn cảmơn những người thân
trong gia đình đãđộng viên, giúp đỡ và tạo điều kiện để
chúng em có thể hoàn thành tốt luận văn này.
Cuối cùng, chúng em xin gửi lời cảmơn thầy Đinh
Điền và các bạn trong nhóm VCL đã giúp đỡ và hỗ trợ
chúng em rất nhiều để hoàn thành luận văn này.
Tp. HồChí Minh, 7-2003
Bùi Thanh Huy - Lê Phương Quang.
Lời cảmơn.

Khoa CNTT - ÐH KHTN TP.HCM
Khoa CNTT - ÐH KHTN TP.HCM
`
Mục lục
Mục lục............................................................................................ ii
Danh sách các hình........................................................................ vi
Lời nói đầu .................................................................................... vii
Chương 1: Tổng quan .................................................................... 1
1.1 Giới thiệu ............................................................................................... 2
1.2 Tổng quan về gán nhãn từ loại ............................................................ 3
1.2.1 Gán nhãn từ loại là gì? ..................................................................... 3
1.2.2 Vai trò của gán nhãn từ loại............................................................. 4
1.3 Các vấn đề gặp phải và hướng giải quyết trong bài toán gán nhãn
từ loại................................................................................................................ 6
1.3.1 Các vấn đề gặp phải khi giải quyết bài toán .................................... 6
1.3.2 Hướng giải quyết.............................................................................. 7
1.4 Bố cục ..................................................................................................... 8
Chương 2: Cơsởlý thuyết............................................................. 9
2.1 Máy học và xử lý ngôn ngữ tự nhiên................................................. 10
2.1.1 Hướng tiếp cận thống kê................................................................ 11
2.1.2 Hướng tiếp cận theo biểu trưng ..................................................... 12
2.1.2.1 Cây quyết định:...................................................................................12
2.1.2.2 Danh sách quyết định..........................................................................13
2.1.2.3 Phương pháp học hướng lỗi dựa trên các luật biến đổi trạng thái
(TBL) 13
2.1.3 Hướng tiếp cận thay thế biểu trưng ............................................... 14
2.1.3.1 Mạng Neural .......................................................................................14
2.1.3.2 Thuật toán di truyền ( Genetic Algorithm : GA) ................................14
2.2 Một số giải thuật áp dụng cho bài toán gán nhãn từ loại ............... 15
2.2.1 Giải thuật học chuyển đổi dựa trên luật cải biến (TBL)................ 15
2.2.1.1 Sơ đồ của giải thuật TBL ....................................................................17
2.2.1.2 Mô tả hoạt động của giải thuật............................................................17
2.2.1.3 Trình bày giải thuật.............................................................................20

