intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu cải tiến phân lớp đa nhãn văn bản và ứng dụng

Chia sẻ: Nguyễn Văn H | Ngày: | Loại File: PDF | Số trang:152

51
lượt xem
7
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận án “Nghiên cứu cải tiến phân lớp đa nhãn văn bản và ứng dụng” tập trung vào bài toán phân lớp đa nhãn. Phân lớp đa nhãn (Multi-Label Classiffication: MLC) hay học đa nhãn (Multi-Label Learning: MLL) là một khung học máy (learning framwork) giám sát mới nổi trong thời gian gần đây. Khung học máy này đã thể hiện sự phù hợp với thực tế và tính ứng dụng rộng rãi trong các bài toán phân lớp, điển hình là trong phân lớp văn bản, phân tích dữ liệu đa phương tiện, sinh học, khai phá mạng xã hội, học điện tử và nhiều miền ứng 3 dụng khác.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu cải tiến phân lớp đa nhãn văn bản và ứng dụng

ĐẠI HỌC QUỐC GIA HÀ NỘI<br /> TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br /> <br /> PHẠM THỊ NGÂN<br /> <br /> NGHIÊN CỨU CẢI TIẾN PHÂN LỚP ĐA NHÃN VĂN BẢN<br /> VÀ ỨNG DỤNG<br /> <br /> LUẬN ÁN TIẾN SĨ CÔNG NGHÊ THÔNG TIN<br /> <br /> Hà Nội – 2017<br /> <br /> ĐẠI HỌC QUỐC GIA HÀ NỘI<br /> TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br /> <br /> PHẠM THỊ NGÂN<br /> <br /> NGHIÊN CỨU CẢI TIẾN PHÂN LỚP ĐA NHÃN VĂN BẢN<br /> VÀ ỨNG DỤNG<br /> <br /> Chuyên ngành: Hệ thống thông tin<br /> Mã số: 62.48.01.04<br /> LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN<br /> <br /> NGƯỜI HƯỚNG DẪN KHOA HỌC:<br /> 1. PGS.TS HÀ QUANG THỤY<br /> 2. PGS.TS PHAN XUÂN HIẾU<br /> <br /> Hà Nội – 2017<br /> <br /> LỜI CAM ĐOAN<br /> Tôi xin cam đoan luận án này là công trình nghiên cứu của riêng tôi. Các<br /> kết quả được viết chung với các tác giả khác đều được sự đồng ý của các đồng<br /> tác giả trước khi đưa vào luận án. Các kết quả nêu trong luận án là trung thực<br /> và chưa từng được công bố trong các công trình nào khác.<br /> Nghiên cứu sinh<br /> <br /> Phạm Thị Ngân<br /> <br /> i<br /> <br /> LỜI CẢM ƠN<br /> Luận án được thực hiện tại Bộ môn Hệ thống thông tin – Khoa Công nghệ<br /> thông tin – Trường Đại học Công nghệ - Đại học quốc gia Hà Nội dưới sự hướng<br /> dẫn khoa học của PGS.TS. Hà Quang Thụy và PGS.TS. Phan Xuân Hiếu.<br /> Trước tiên tôi xin bày tỏ lòng biết ơn sâu sắc tới thầy Hà Quang Thụy và<br /> thầy Phan Xuân Hiếu, những người đã đưa tôi tiếp cận và đạt được những thành<br /> công trong lĩnh vực nghiên cứu của mình. Tôi đặc biệt gửi lời cảm ơn tới thầy Hà<br /> Quang Thụy đã luôn tận tâm, động viên, khuyến khích và chỉ dẫn tôi hoàn thành<br /> được bản luận án này.<br /> Tôi xin bày tỏ lòng biết ơn tới thầy Nguyễn Trí Thành đã nhiệt tình hướng<br /> dẫn và truyền đạt các kinh nghiệm nghiên cứu trong quá trình tôi thực hiện luận án.<br /> Tôi xin chân thành cảm ơn tới tập thể các thầy cô giáo, các nhà khoa học<br /> thuộc Trường Đại học Công nghệ (đặc biệt là các thành viên của Phòng thí nghiệm<br /> khoa học dữ liệu và công nghệ tri thức – DS&KTlab) - Đại học Quốc gia Hà Nội đã<br /> giúp đỡ về chuyên môn và tạo điều kiện thuận lợi cho tôi trong suốt thời gian học<br /> tập và nghiên cứu.<br /> Tôi xin bày tỏ lòng cảm ơn chân thành tới các cộng sự đã cùng tôi thực hiện<br /> các công trình nghiên cứu và các bạn đồng nghiệp đã giúp đỡ, trao đổi và chia sẻ<br /> những kinh nghiệm về chuyên môn, đóng góp các ý kiến quý báu cho tôi trong quá<br /> trình nghiên cứu.<br /> Tôi xin trân trọng cảm ơn các thầy cô trong hội đồng chuyên môn đã đóng<br /> góp các ý kiến quý báu để tôi hoàn thiện luận án.<br /> Tôi cũng bày tỏ lòng lòng cảm ơn sâu sắc tới Ban giám đốc Học viện Cảnh<br /> sát nhân dân; Tập thể lãnh đạo Bộ môn Toán-Tin học, Học viện Cảnh sát nhân dân<br /> đã tạo kiện thuận lợi cho tôi trong quá trình nghiên cứu; cảm ơn các đồng chí trong<br /> Bộ môn Toán-Tin học đã luôn ủng hộ, quan tâm và động viên tôi.<br /> Tôi luôn biết ơn những người thân trong gia đình, bố mẹ nội, bố mẹ ngoại,<br /> các anh chị em đã luôn chia sẻ khó khăn, động viên và là chỗ dựa tinh thần vững<br /> chắc cho tôi trong suốt thời gian qua.<br /> <br /> ii<br /> <br /> MỤC LỤC<br /> LỜI CAM ĐOAN ....................................................................................................... i<br /> LỜI CẢM ƠN ............................................................................................................ii<br /> MỤC LỤC ................................................................................................................ iii<br /> DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT ...........................................vii<br /> DANH MỤC CÁC BẢNG ....................................................................................... ix<br /> DANH MỤC CÁC HÌNH VẼ................................................................................... x<br /> MỞ ĐẦU .................................................................................................................... 1<br /> Chương 1.<br /> <br /> TỪ PHÂN LỚP ĐƠN NHÃN TỚI PHÂN LỚP ĐA NHÃN ...... 10<br /> <br /> 1.1. Từ phân lớp đơn nhãn đơn thể hiện tới phân lớp đa nhãn đa thể hiện .... 10<br /> 1.1.1.<br /> <br /> Phân lớp đơn nhãn ................................................................................. 10<br /> <br /> 1.1.2.<br /> <br /> Phân lớp đơn nhãn đa thể hiện .............................................................. 11<br /> <br /> 1.1.3.<br /> <br /> Phân lớp đa nhãn ................................................................................... 12<br /> <br /> 1.1.4.<br /> <br /> Phân lớp đa nhãn đa thể hiện ................................................................. 13<br /> <br /> 1.2. Giới thiệu chung về phân lớp đa nhãn ......................................................... 14<br /> 1.2.1.<br /> <br /> Kỹ thuật phân lớp đa nhãn ..................................................................... 15<br /> <br /> 1.2.1.1.<br /> <br /> Tiếp cận chuyển đổi bài toán .......................................................16<br /> <br /> 1.2.1.2.<br /> <br /> Tiếp cận thích nghi thuật toán......................................................22<br /> <br /> 1.2.1.3.<br /> <br /> Tóm tắt về các thuật toán được giới thiệu ...................................28<br /> <br /> 1.2.2.<br /> <br /> Dữ liệu đa nhãn ..................................................................................... 29<br /> <br /> 1.2.2.1.<br /> <br /> Các độ đo dữ liệu đa nhãn............................................................29<br /> <br /> 1.2.2.2.<br /> <br /> Phân bố nhãn ................................................................................30<br /> <br /> 1.2.2.3.<br /> <br /> Mối quan hệ giữa các nhãn ..........................................................30<br /> <br /> 1.2.3.<br /> <br /> Đánh giá phân lớp đa nhãn .................................................................... 31<br /> <br /> 1.2.3.1.<br /> <br /> Các độ đo dựa trên mẫu ...............................................................32<br /> <br /> 1.2.3.2.<br /> <br /> Các độ đo dựa trên nhãn ..............................................................34<br /> <br /> 1.3. Giảm chiều dữ liệu trong phân lớp đa nhãn ................................................ 36<br /> iii<br /> <br />
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
14=>2