ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
VŨ THỊ THU HƢƠNG<br />
<br />
ỨNG DỤNG PHƢƠNG PHÁP PHÂN CỤM MỜ<br />
CHO BÀI TOÁN PHÂN TÍCH THÔNG TIN RỦI<br />
RO QUẢN LÝ THUẾ DOANH NGHIỆP<br />
<br />
LUẬN VĂN THẠC SĨ QUẢN LÝ HỆ THỐNG THÔNG TIN<br />
<br />
Hà Nội – 2017<br />
<br />
ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ<br />
<br />
VŨ THỊ THU HƢƠNG<br />
<br />
ỨNG DỤNG PHƢƠNG PHÁP PHÂN CỤM MỜ<br />
CHO BÀI TOÁN PHÂN TÍCH THÔNG TIN RỦI<br />
RO QUẢN LÝ THUẾ DOANH NGHIỆP<br />
<br />
Ngành: Công nghệ thông tin<br />
Chuyên ngành: Quản lý Hệ thống thông tin<br />
Mã số:<br />
<br />
LUẬN VĂN THẠC SĨ QUẢN LÝ HỆ THỐNG THÔNG TIN<br />
<br />
NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS. TS. Nguyễn Đình Hóa<br />
<br />
Hà Nội – 2017<br />
<br />
2<br />
<br />
LỜI CAM ĐOAN<br />
Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng cá nhân<br />
tôi, không sao chép của ai do tôi tự nghiên cứu, đọc, dịch tài liệu, tổng hợp và<br />
thực hiện. Nội dung lý thuyết trong trong luận văn tôi có sử dụng một số tài liệu<br />
tham khảo như đã trình bày trong phần tài liệu tham khảo. Các số liệu, chương<br />
trình phần mềm và những kết quả trong luận văn là trung thực và chưa được<br />
công bố trong bất kỳ một công trình nào khác.<br />
<br />
Hà Nội, tháng 10 năm 2017<br />
Học viên thực hiện<br />
<br />
Vũ Thị Thu Hƣơng<br />
<br />
3<br />
<br />
LỜI CẢM ƠN<br />
Lời đầu tiên, em xin gửi lời biết ơn sâu sắc đến PGS.TS. Nguyễn Đình<br />
Hóa, TS. Lê Hoàng Sơn người đã tạo điều kiện thuận lợi, tận tình hướng dẫn, chỉ<br />
bảo, giúp đỡ em trong suốt quá trình làm luận văn.<br />
Em cũng xin gửi lời cảm ơn đến các thầy cô giáo trường Đại học Công<br />
nghệ - Đại học Quốc Gia Hà Nội, các thầy cô khoa Công nghệ thông tin đã<br />
truyền đạt những kiến thức và giúp đỡ em trong suốt quá trình học của mình.<br />
Và cuối cùng em xin gửi lời cảm ơn tới các đồng nghiệp, gia đình và bạn<br />
bè, những người đã luôn ủng hộ, động viên và tạo mọi điều kiện giúp đỡ để<br />
em có được kết quả như ngày hôm nay.<br />
Hà Nội, tháng 10 năm 2017<br />
Học viên<br />
<br />
Vũ Thị Thu Hƣơng<br />
<br />
4<br />
<br />
MỤC LỤC<br />
LỜI CAM ĐOAN.......................................................................................................... 2<br />
LỜI CẢM ƠN ............................................................................................................. 3<br />
DANH MỤC CÁC KÝ HIỆU VÀ CÁC TỪ VIẾT TẮT........................................... 6<br />
DANH MỤC HÌNH MINH HOẠ VÀ BẢNG BIỂU.................................................. 7<br />
MỞ ĐẦU<br />
<br />
............................................................................................................. 9<br />
<br />
CHƢƠNG 1:<br />
<br />
TỔNG QUAN VỀ PHÂN CỤM DỮ LIỆU ................................... 11<br />
<br />
1.1. Giới thiệu về khai phá dữ liệu ..................................................................... 11<br />
1.1.1. Khai phá dữ liệu là gì? ............................................................................. 11<br />
1.1.2. Các giai đoạn của quá trình khai phá dữ liệu ........................................ 12<br />
1.2. Tổng quan về phân cụm dữ liệu .................................................................. 12<br />
1.2.1. Khái niệm phân cụm dữ liệu ................................................................... 13<br />
1.2.2. Các mục tiêu của phân cụm dữ liệu ........................................................ 13<br />
1.2.3. Một số ứng dụng của phân cụm dữ liệu ................................................. 15<br />
1.2.4. Các yêu cầu của phân cụm dữ liệu ......................................................... 15<br />
1.3. Một số kỹ thuật tiếp cận trong phân cụm dữ liệu...................................... 16<br />
1.3.1. Phương pháp phân cụm phân hoạch ...................................................... 16<br />
1.3.2. Phương pháp phân cụm phân cấp .......................................................... 17<br />
1.3.3. Phương pháp tiếp cận dựa trên mật độ ................................................... 19<br />
1.3.4. Phương pháp phân cụm dựa trên lưới .................................................... 20<br />
1.3.5. Phương pháp phân cụm dựa trên mô hình............................................. 20<br />
CHƢƠNG 2: GIỚI THIỆU BÀI TOÁN PHÂN CỤM MỜ VÀ CÁC PHƢƠNG<br />
PHÁP XÁC ĐỊNH SỐ CỤM TRONG GOM CỤM DỮ LIỆU .............................. 22<br />
2.1. Bài toán phân cụm mờ ................................................................................. 22<br />
2.1.1. Giới thiệu về phân cụm mờ ...................................................................... 22<br />
2.1.2. Thuật toán Fuzzy C-Mean (FCM) .......................................................... 22<br />
2.1.2.1. Hàm mục tiêu ....................................................................................... 22<br />
2.1.2.2. Thuật toán FCM .................................................................................. 25<br />
2.1.2.3. Đánh giá ............................................................................................... 27<br />
2.2. Các phƣơng pháp xác định số cụm trong gom cụm dữ liệu ..................... 27<br />
2.2.1. Xác định số cụm dựa trên phương pháp truyền thống .......................... 28<br />
2.2.2. Xác định số cụm bằng phương pháp Eblow ........................................... 29<br />
<br />