Báo cáo "Khai phá dữ liệu phát hiện luật kết hợp và ứng dụng đối với kho dữ liệu của ngân hàng"
lượt xem 51
download
Tìm hiểu những nét khái quát nhất về hệ thống xử lý giao dịch trực tuyến (OLTP), Kho dữ liệu (Data warehouse) và hệ thống phân tích dữ liệu trực tuyến (OLAP). Trình bày các vấn đề chung, cơ bản nhất về Luật kết hợp, giải thuật kinh điển Apriori, khai phá luật kết hợp với OLAP và sinh luật kết hợp từ tập mục phổ biến. Nghiên cứu xây dựng khung ứng dụng, bao gồm các công việc: tập hợp, làm sạch, chuẩn hoá dữ liệu, xây dựng Data-cube, khai phá luật kết hợp từ Data-cube; từ đó triển...
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Báo cáo "Khai phá dữ liệu phát hiện luật kết hợp và ứng dụng đối với kho dữ liệu của ngân hàng"
- Khai phá dữ liệu phát hiện luật kết hợp và ứng dụng đối với kho dữ liệu của ngân hàng Nguyễn Thị Thu Trang Trường Đại học Công nghệ Luận văn Thạc sĩ ngành: Công nghệ phần mềm; Mã số: 60 48 10 Người hướng dẫn: PGS.TS. Vũ Đức Thi Năm bảo vệ: 2008 Abstract: Tìm hiểu những nét khái quát nhất về hệ thống xử lý giao dịch trực tuyến (OLTP), Kho dữ liệu (Data warehouse) và hệ thống phân tích dữ liệu trực tuyến (OLAP). Trình bày các vấn đề chung, cơ bản nhất về Luật kết hợp, giải thuật kinh điển Apriori, khai phá luật kết hợp với OLAP và sinh luật kết hợp từ tập mục phổ biến. Nghiên cứu xây dựng khung ứng dụng, bao gồm các công việc: tập hợp, làm sạch, chuẩn hoá dữ liệu, xây dựng Data-cube, khai phá luật kết hợp từ Data-cube; từ đó triển khai ứng dụng minh hoạ đối với Kho dữ liệu Ngân hàng Keywords: Dữ liệu trực tuyến; Khai phá dữ liệu; Kho dữ liệu; Ngân hàng Content MỞ ĐẦU Khai phá dữ liệu trong những năm gần đây đã và đang được ứng dụng rộng rãi trong nhiều lĩnh vực như: Ngân hàng, Tài chính và thị trường chứng khoán, Thương mại, Giáo dục, Y tế, Sinh học, Bưu chính viễn thông, … với nhiều hướng tiếp cận khác nhau như: Phân lớp/Dự đoán, Phân cụm, Luật kết hợp, … Các kỹ thuật chính được áp dụng trong khai phá dữ liệu phần lớn được thừa kế từ lĩnh vực: Cơ sở dữ liệu, Máy tự học (Machine learning), Trí tuệ nhân tạo, Lý thuyết thông tin, Xác suất thống kê, … và nổi trội trong đó là phương pháp Khai phá dữ liệu phát hiện luật kết hợp với cơ sở lý thuyết vững chãi và đầy tính ứng dụng thực tiễn. Mặc dù trên thế giới, Khai phá dữ liệu bằng luật kết hợp đã và đang là một trong những phương pháp phổ du ̣ng và hiệu quả , được nhiều nhà khoa học và các tổ chức , doanh nghiê ̣p tìm hiểu , nghiên cứu, thử nghiệm, phát triển và kết quả đã thu được những thành công lớn đặc biệt trong lĩnh vực Ngân hàng và Tài chính trên những Kho dữ liệu khổng lồ. Tuy nhiên ở nước ta, các nhà quản trị thậm chí còn chưa biết làm sao tổ chức dữ liệu của mình thành một Kho dữ liệu, họ mới chỉ dừng lại ở việc trích rút được những báo cáo đơn giản đáp ứng các nghiệp vụ hàng ngày, chưa có khái niệm về Kho dữ liệu, về phân tích OLAP, chứ chưa nói đến là Khai phá dữ liệu từ Kho dữ liệu đó. Chính vì vậy đề tài tập trung vào vấn đề rất thực tiễn này: Khai phá dữ liệu phát hiện luật kết hợp và Ứng dụng đối với Kho dữ liệu của ngân hàng. Luận văn được tổ chức thành 3 chương: Chương 1: Kho dữ liệu và Phân tích dữ liệu trực tuyến
- Trình bày những nét khái quát nhất về Kho dữ liệu (Data warehouse) và Phân tích dữ liệu trực tuyến (OLAP). Chương 2: Khai phá dữ liệu phát hiện luật kết hợp Trình bày các vấn đề chung, cơ bản nhất về Luật kết hợp, giải thuật kinh điển Apriori và Khai phá luật kết hợp dựa trên OLAP. Chương 3: Xây dựng ứng dụng minh hoạ Triển khai ứng dụng minh hoạ đối với Kho dữ liệu Ngân hàng. References Danh sách tài liệu tham khảo tiếng Việt [001] Tạ Liên Dung (2003), Một số vấn đề khai phá dữ liệu, Luận văn thạc sĩ CNTT, Đại học Quốc gia Hà Nội. [002] Trần Vĩnh Hoàng (2007), Một số phương pháp khai phá dữ liệu sinh luật kết hợp, Luận văn thạc sĩ CNTT, Đại học Quốc gia Hà Nội. [003] Hoàng Kiếm (4/2005), Giải một bài toán trên máy tính như thế nào, Tập 3 (tái bản lần thứ nhất). NXB Giáo dục. [004] Nguyễn Hùng Sơn (2006), Bài giảng Tập thô và Khai phá dữ liệu. [005] Vũ Đức Thi, Lê Hải Khôi (1999), Một số nguyên lý hoạt động của kho dữ liệu. [006] Vũ Đức Thi (1997), Cơ sở dữ liệu – Kiến thức và thực hành. NXB Thống Kê. [007] Nguyễn Thanh Thuỷ (8/2001), Bài giảng Khai phá dữ liệu - Kỹ thuật và ứng dụng. Danh sách tài liệu tham khảo tiếng Anh [101] (1995) J.Gray, S.Chaudhuri, A.Bosworth, A.Layman, D.Reichart, M.Venkatrao, F.Pellow and H.Pirahesh, Data-cube: a relational aggregation operator generalizing group-by, cross-tab and sub-totals, Microsoft Technical report. [102] J.Han (1999), OLAP-Mining: An integration of OLAP with Data-Mining, Simon Fraser University. [103] J.Han and M.Kamber (2001), Data Mining: Concepts and Techniques, Hacours Science and Technology Company, USA. [104] W.H.Inmon (1996), Building the Data Warehouse, John Wiley & Sons, Chichester, second edition. [105] W.H.Inmon (1995), "What is a Data Warehouse?", Prism, Volume 1. [106] W.H.Inmon, C. Kelly (1993), Rdb/VMS: Developing the Data Warehouse, QED Publishing Group, Boston, Massachussetts. [107] Mehmed Kantardzic (2002), Data Mining: Concepts, Models, Methods and Algorithms, Wiley-IEEE Press. [108] R.Kimball (1996), The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses, John Wiley & Sons. [109] M. Levene, G. Loizou (2000), “Why is the Snowflake Schema a Good Data Warehouse Design?”, Birkbeck College, University of London. [110] M.J.Zaki and M.Ogihara (6/1998), Theoretical Foundations of Association Rules, In 3rd ACM SIGMOD Workshop on Research Issues in Data mining and Knowledge Discovery. [111] Hua Zhu (1998), Online Analytical Mining of Association Rules, Master thesis, Simon Fraser University. 2
- Danh sách Websites tham khảo [L01] http://citeseer.ist.psu.edu/ [L02] http://citeseer.ist.psu.edu/agrawal93mining.html [L03] http://citeseer.ist.psu.edu/han99mining.html [L04] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.21.3808 [L05] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.74.3044 [L06] http://www.cs.sfu.ca/ [L07] http://www.cse.ohio-state.edu/~agrawal/Research_new/mining.htm [L08] http://en.wikipedia.org/wiki/Data_mining [L09] http://en.wikipedia.org/wiki/Association_rule_mining [L10] http://www.filibeto.org/sun/lib/nonsun/oracle/11.1.0.6.0/B28359_01/datamine.111/ b28129/intro_concepts.htm [L11] http://freedatawarehouse.com/tutorials/dmtutorial/Dimensional%20Modeling%20 Tutorial.aspx [L12] http://freedatawarehouse.com/tutorials/dmtutorial/Star%20Schema.aspx [L13] http://freedatawarehouse.com/tutorials/dmtutorial/Snowflake%20Schema.aspx [L14] http://www.intranetjournal.com/features/datawarehousing.html [L15] http://it.toolbox.com/blogs/enterprise-solutions/snowflake-schema-modelling-data- warehouse-20809 3
CÓ THỂ BẠN MUỐN DOWNLOAD
-
Báo cáo: NGHIÊN CỨU BÀI TOÁN GOM CỤM TRONG KHAI PHÁ DỮ LIỆU
12 p | 421 | 72
-
Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm
69 p | 264 | 71
-
BÁO CÁO "ỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG CÔNG CỤ DỰ ĐOÁN KẾT QUẢ HỌC TẬP CỦA SINH VIÊN "
8 p | 195 | 34
-
LUẬN VĂN: Tìm hiểu Clementine, áp dụng vào bài khai phá dữ liệu thống kê dân số
56 p | 225 | 30
-
Báo cáo nghiên cứu khoa học: " PHỤ THUỘC DỮ LIỆU VÀ TÁC ĐỘNG CỦA NÓ ĐỐI VỚI BÀI TOÁN PHÂN LỚP CỦA KHAI PHÁ DỮ LIỆU"
10 p | 176 | 27
-
LUẬN VĂN:GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC
59 p | 119 | 24
-
Báo cáo "Khai phá Luật kết hợp trong cơ sở dữ liệu đa phương tiện "
22 p | 130 | 22
-
Báo cáo nghiên cứu khoa học: "Một thuật toán khai phá tập mục lợi ích cao trong cơ sở dữ liệu"
12 p | 126 | 19
-
Luận văn Thạc sĩ ngành công nghệ thông tin: Khai phá dữ liệu và ứng dụng trong y tế dự phòng
63 p | 107 | 15
-
Báo cáo nghiên cứu khoa học: Nghiên cứu ứng dụng một số thuật toán khai phá dữ liệu hỗ trợ phân tích cơ sở dữ liệu bán hàng siêu thị
96 p | 31 | 11
-
Đề tài nghiên cứu khoa học cấp trường: Nghiên cứu ứng dụng công cụ khai phá dữ liệu trong bài toán về giao dịch tỷ giá
45 p | 37 | 10
-
Đề tài khoa học và công nghệ cấp cơ sở: Nghiên cứu ứng dụng kĩ thuật khai phá dữ liệu dạng lưới trong lĩnh vực tài chính
44 p | 39 | 10
-
Luận văn Thạc sĩ Hệ thống thông tin: Khai phá dữ liệu dựa trên báo cáo tình hình, kết quả giải quyết thủ tục hành chính thuế tại Cục thuế Bình Dương
81 p | 28 | 9
-
Báo cáo " Thuật toán khai phá tập mục dữ liệu thường xuyên trong CSDL gia tăng dựa trên phân lớp dữ liệu"
12 p | 65 | 7
-
Luận văn Thạc sĩ Máy tính: Nghiên cứu một số phương pháp khai phá dữ liệu phát hiện phản ứng có hại của thuốc
75 p | 32 | 7
-
Luận văn Thạc sĩ Kinh tế: Phân tích chỉ số tài chính để phát hiện gian lận, sai sót trong báo cáo tài chính của các doanh nghiệp niêm yết trên thị trường chứng khoán Việt Nam
135 p | 67 | 6
-
Tóm tắt báo cáo nghiên cứu khoa học " NGHIÊN CỨU VÀ PHÁT TRIỂN MỘT SỐ MÔ HÌNH ÁP DỤNG TÍNH TOÁN MỀM CHO CÁC HỆ THỐNG THÔNG MINH "
4 p | 67 | 5
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn