ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN
BÁO CÁO TNG KT
ĐỀ TÀI KHOA HC VÀ CÔNG NGH
CẤP CƠ SỞ
NGHIÊN CU NG DNG K THUT
KHAI PHÁ D LIU DẠNG LƯỚI
TRONG LĨNH VỰC TÀI CHÍNH
Mã s: T2016-07-07
Ch nhiệm đề tài: Th.s Trn Thu Thy
Đà Nng, 12/2016
2
ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN
BÁO CÁO TNG KT
ĐỀ TÀI KHOA HC VÀ CÔNG NGH
CẤP CƠ SỞ
NGHIÊN CU NG DNG K THUT
KHAI PHÁ D LIU DẠNG LƯỚI
TRONG LĨNH VỰC TÀI CHÍNH
Mã s: T2016-07-07
Ch nhiệm đề tài: Th.s Trn Thu Thy
Xác nhn của cơ quan chủ trì đề tài Ch nhiệm đề tài
Đà Nng, 12/2016
3
MC LC
M ĐẦU ......................................................................................................................... 8
1. TÍNH CP THIT ............................................................................................................................8
2. MC TIÊU NGHIÊN CU ..............................................................................................................9
3. ĐỐI TƯỢNG VÀ PHM VI NGHIÊN CU ..................................................................................9
4. B CỤC Đ TÀI ..............................................................................................................................9
CHƯƠNG 1: TỔNG QUAN V KHAI PHÁ D LIU ......................................... 10
1.1 KHAI PHÁ D LIU. ..................................................................................................................10
1.2 CÁC THUT TOÁN VÀ K THUT KHAI PHÁ D LIU. ..................................................11
1.2.1. Phân loi. ...............................................................................................................................13
1.2.2. Lut kết hp ...........................................................................................................................14
1.2.3 Vic phân cm (Clustering) ...................................................................................................14
1.2.4 D đoán ..................................................................................................................................17
1.2.4.1 Các mu tun t ...................................................................................................................17
1.2.4.2 Các cây quyết định ..............................................................................................................18
1.2.4.3 Các t hp ...........................................................................................................................19
1.2.4.4 X lý (b nh) dài hn ........................................................................................................19
1.2.4.5 Chun b và trin khai d liu .............................................................................................20
1.2.4.6 Vic xây dng trên SQL ......................................................................................................21
1.2.4.7 Các cơ sở d liu tài liu và MapReduce ............................................................................23
1.3 KT LUN ...................................................................................................................................26
CHƯƠNG 2: PHÂN CỤM D LIỆU VÀ PHƯƠNG PHÁP PHÂN CỤM
DỰA TRÊN LƯỚI ....................................................................................................... 27
2.1 KHÁI NIM CHUNG ..................................................................................................................27
2.2 BÀI TOÁN PHÂN CỤM TRÊN LƯỚI ........................................................................................27
2.3 CÁC PHƯƠNG PHÁP PHÂN CM ............................................................................................28
2.3.1 Phương pháp phân cụm phân hoch .......................................................................................28
2.3.2 Phương pháp phân cụm phân cp ...........................................................................................29
2.3.3 Phương pháp phân cụm da trên mật độ ................................................................................30
2.3.4 Phương pháp phân cụm dựa trên lưới ....................................................................................31
2.3.5 Phương pháp phân cụm da trên mô hình ..............................................................................32
4
CHƯƠNG 3: NG DỤNG KĨ THUẬT PHÂN CM DỰA TRÊN LƯỚI TRONG
LĨNH VC TÀI CHÍNH VÀ BÁO CÁO KT QU NGHIÊN CU ................... 33
3.1. MARKETING ..............................................................................................................................34
3.2 QUN LÝ RI RO.......................................................................................................................34
3.3 PHÁT HIN GIAN LN ..............................................................................................................37
3.4 QUN TR QUAN H KHÁCH HÀNG .....................................................................................37
3.5 ĐÁNH GIÁ KẾT QU NGHIÊN CU .......................................................................................38
3.5.1 Nghiên cu tp trung ng dụng vào lĩnh vực qung bá và bán sn phm trong h thng ngân
hàng Vit Nam ................................................................................................................................38
KT LUN .................................................................................................................. 42
TÀI LIU THAM KHO ........................................................................................... 44
5
DANH MC T VIT TT
STT
Cm t
Viết tc
1.
Management Information System
MIS
2.
Phân cm d liu
PCDL
DANH MC HÌNH NH
Hình 1.1: Phác tho quá trình ........................................................................................ 12
Hình 1.2: Phác tho vic phân cm ............................................................................... 16
Hình 1.3: Cây quyết đnh ............................................................................................... 18
Hình 1.4: Chun b d liu ............................................................................................ 21
Hình 1.5: Đnh dng cho vic phân tích d liu c th ................................................. 22
Hình 1.6: Cu trúc KPDL .............................................................................................. 24
Hình 1.7: Ni chui đu ra ca MapReduce ca bn theo tun t ................................ 25
Hình 2.1. Các chiến lưc phân cm phân cp ............................................................... 30
Hình 2.2: Mt s hình dng khám phá bi phân cụm dưa trên mt đ ......................... 31
Hình 2.3: Phân cm da trên lưi ................................................................................. 32
Hình 3.1: N có kh ng mấy vn của năm 2015 ....................................................... 36
Hình 3.2: Li nhuận trước thuế của các ngân hàng năm 2015-2016 ............................ 39
Hình 3.3: Tng kết doanh s phát trin th tính đến 2015 ............................................ 40
Hình 3.4: Biểu đồ phân chia th phn th nh đến 2015 ............................................... 41