ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
PHẠM THỊ NGÂN<br />
<br />
NGHIÊN CỨU CẢI TIẾN PHÂN LỚP ĐA NHÃN VĂN BẢN<br />
VÀ ỨNG DỤNG<br />
<br />
LUẬN ÁN TIẾN SĨ CÔNG NGHÊ THÔNG TIN<br />
<br />
Hà Nội – 2017<br />
<br />
ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
PHẠM THỊ NGÂN<br />
<br />
NGHIÊN CỨU CẢI TIẾN PHÂN LỚP ĐA NHÃN VĂN BẢN<br />
VÀ ỨNG DỤNG<br />
<br />
Chuyên ngành: Hệ thống thông tin<br />
Mã số: 62.48.01.04<br />
LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN<br />
<br />
NGƯỜI HƯỚNG DẪN KHOA HỌC:<br />
1. PGS.TS HÀ QUANG THỤY<br />
2. PGS.TS PHAN XUÂN HIẾU<br />
<br />
Hà Nội – 2017<br />
<br />
LỜI CAM ĐOAN<br />
Tôi xin cam đoan luận án này là công trình nghiên cứu của riêng tôi. Các<br />
kết quả được viết chung với các tác giả khác đều được sự đồng ý của các đồng<br />
tác giả trước khi đưa vào luận án. Các kết quả nêu trong luận án là trung thực<br />
và chưa từng được công bố trong các công trình nào khác.<br />
Nghiên cứu sinh<br />
<br />
Phạm Thị Ngân<br />
<br />
i<br />
<br />
LỜI CẢM ƠN<br />
Luận án được thực hiện tại Bộ môn Hệ thống thông tin – Khoa Công nghệ<br />
thông tin – Trường Đại học Công nghệ - Đại học quốc gia Hà Nội dưới sự hướng<br />
dẫn khoa học của PGS.TS. Hà Quang Thụy và PGS.TS. Phan Xuân Hiếu.<br />
Trước tiên tôi xin bày tỏ lòng biết ơn sâu sắc tới thầy Hà Quang Thụy và<br />
thầy Phan Xuân Hiếu, những người đã đưa tôi tiếp cận và đạt được những thành<br />
công trong lĩnh vực nghiên cứu của mình. Tôi đặc biệt gửi lời cảm ơn tới thầy Hà<br />
Quang Thụy đã luôn tận tâm, động viên, khuyến khích và chỉ dẫn tôi hoàn thành<br />
được bản luận án này.<br />
Tôi xin bày tỏ lòng biết ơn tới thầy Nguyễn Trí Thành đã nhiệt tình hướng<br />
dẫn và truyền đạt các kinh nghiệm nghiên cứu trong quá trình tôi thực hiện luận án.<br />
Tôi xin chân thành cảm ơn tới tập thể các thầy cô giáo, các nhà khoa học<br />
thuộc Trường Đại học Công nghệ (đặc biệt là các thành viên của Phòng thí nghiệm<br />
khoa học dữ liệu và công nghệ tri thức – DS&KTlab) - Đại học Quốc gia Hà Nội đã<br />
giúp đỡ về chuyên môn và tạo điều kiện thuận lợi cho tôi trong suốt thời gian học<br />
tập và nghiên cứu.<br />
Tôi xin bày tỏ lòng cảm ơn chân thành tới các cộng sự đã cùng tôi thực hiện<br />
các công trình nghiên cứu và các bạn đồng nghiệp đã giúp đỡ, trao đổi và chia sẻ<br />
những kinh nghiệm về chuyên môn, đóng góp các ý kiến quý báu cho tôi trong quá<br />
trình nghiên cứu.<br />
Tôi xin trân trọng cảm ơn các thầy cô trong hội đồng chuyên môn đã đóng<br />
góp các ý kiến quý báu để tôi hoàn thiện luận án.<br />
Tôi cũng bày tỏ lòng lòng cảm ơn sâu sắc tới Ban giám đốc Học viện Cảnh<br />
sát nhân dân; Tập thể lãnh đạo Bộ môn Toán-Tin học, Học viện Cảnh sát nhân dân<br />
đã tạo kiện thuận lợi cho tôi trong quá trình nghiên cứu; cảm ơn các đồng chí trong<br />
Bộ môn Toán-Tin học đã luôn ủng hộ, quan tâm và động viên tôi.<br />
Tôi luôn biết ơn những người thân trong gia đình, bố mẹ nội, bố mẹ ngoại,<br />
các anh chị em đã luôn chia sẻ khó khăn, động viên và là chỗ dựa tinh thần vững<br />
chắc cho tôi trong suốt thời gian qua.<br />
<br />
ii<br />
<br />
MỤC LỤC<br />
LỜI CAM ĐOAN ....................................................................................................... i<br />
LỜI CẢM ƠN ............................................................................................................ii<br />
MỤC LỤC ................................................................................................................ iii<br />
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ...........................................vii<br />
DANH MỤC CÁC BẢNG ....................................................................................... ix<br />
DANH MỤC CÁC HÌNH VẼ................................................................................... x<br />
MỞ ĐẦU .................................................................................................................... 1<br />
Chương 1.<br />
<br />
TỪ PHÂN LỚP ĐƠN NHÃN TỚI PHÂN LỚP ĐA NHÃN ...... 10<br />
<br />
1.1. Từ phân lớp đơn nhãn đơn thể hiện tới phân lớp đa nhãn đa thể hiện .... 10<br />
1.1.1.<br />
<br />
Phân lớp đơn nhãn ................................................................................. 10<br />
<br />
1.1.2.<br />
<br />
Phân lớp đơn nhãn đa thể hiện .............................................................. 11<br />
<br />
1.1.3.<br />
<br />
Phân lớp đa nhãn ................................................................................... 12<br />
<br />
1.1.4.<br />
<br />
Phân lớp đa nhãn đa thể hiện ................................................................. 13<br />
<br />
1.2. Giới thiệu chung về phân lớp đa nhãn ......................................................... 14<br />
1.2.1.<br />
<br />
Kỹ thuật phân lớp đa nhãn ..................................................................... 15<br />
<br />
1.2.1.1.<br />
<br />
Tiếp cận chuyển đổi bài toán .......................................................16<br />
<br />
1.2.1.2.<br />
<br />
Tiếp cận thích nghi thuật toán......................................................22<br />
<br />
1.2.1.3.<br />
<br />
Tóm tắt về các thuật toán được giới thiệu ...................................28<br />
<br />
1.2.2.<br />
<br />
Dữ liệu đa nhãn ..................................................................................... 29<br />
<br />
1.2.2.1.<br />
<br />
Các độ đo dữ liệu đa nhãn............................................................29<br />
<br />
1.2.2.2.<br />
<br />
Phân bố nhãn ................................................................................30<br />
<br />
1.2.2.3.<br />
<br />
Mối quan hệ giữa các nhãn ..........................................................30<br />
<br />
1.2.3.<br />
<br />
Đánh giá phân lớp đa nhãn .................................................................... 31<br />
<br />
1.2.3.1.<br />
<br />
Các độ đo dựa trên mẫu ...............................................................32<br />
<br />
1.2.3.2.<br />
<br />
Các độ đo dựa trên nhãn ..............................................................34<br />
<br />
1.3. Giảm chiều dữ liệu trong phân lớp đa nhãn ................................................ 36<br />
iii<br />
<br />