Khoa Khoa Học & Kỹ Thuật Máy Tính<br />
Trường Đại Học Bách Khoa Tp. Hồ Chí Minh<br />
<br />
Chương 4: Phân loại dữ liệu<br />
Cao Học Ngành Khoa Học Máy Tính<br />
Giáo trình điện tử<br />
Biên soạn bởi: TS. Võ Thị Ngọc Châu<br />
(chauvtn@cse.hcmut.edu.vn)<br />
Học kỳ 1 – 2011-2012<br />
<br />
1<br />
<br />
1<br />
<br />
Tài liệu tham khảo<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
[1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and<br />
Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006.<br />
[2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data<br />
Mining”, MIT Press, 2001.<br />
[3] David L. Olson, Dursun Delen, “Advanced Data Mining<br />
Techniques”, Springer-Verlag, 2008.<br />
[4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory,<br />
Methodology, Techniques, and Applications”, Springer-Verlag, 2006.<br />
[5] Hillol Kargupta, Jiawei Han, Philip S. Yu, Rajeev Motwani, and<br />
Vipin Kumar, “Next Generation of Data Mining”, Taylor & Francis<br />
Group, LLC, 2009.<br />
[6] Daniel T. Larose, “Data mining methods and models”, John Wiley<br />
& Sons, Inc, 2006.<br />
[7] Ian H.Witten, Eibe Frank, “Data mining : practical machine<br />
learning tools and techniques”, Second Edition, Elsevier Inc, 2005.<br />
[8] Florent Messeglia, Pascal Poncelet & Maguelonne Teisseire,<br />
“Successes and new directions in data mining”, IGI Global, 2008.<br />
[9] Oded Maimon, Lior Rokach, “Data Mining and Knowledge<br />
Discovery Handbook”, Second Edition, Springer Science + Business<br />
Media, LLC 2005, 2010.<br />
<br />
2<br />
<br />
2<br />
<br />
Nội dung<br />
<br />
<br />
Chương 1: Tổng quan về khai phá dữ liệu<br />
<br />
<br />
<br />
Chương 2: Các vấn đề tiền xử lý dữ liệu<br />
<br />
<br />
<br />
<br />
Chương 3: Hồi qui dữ liệu<br />
Chương 4: Phân loại dữ liệu<br />
<br />
<br />
<br />
Chương 5: Gom cụm dữ liệu<br />
<br />
<br />
<br />
Chương 6: Luật kết hợp<br />
<br />
<br />
<br />
Chương 7: Khai phá dữ liệu và công nghệ cơ sở<br />
dữ liệu<br />
Chương 8: Ứng dụng khai phá dữ liệu<br />
<br />
<br />
<br />
<br />
<br />
Chương 9: Các đề tài nghiên cứu trong khai phá<br />
dữ liệu<br />
Chương 10: Ôn tập<br />
<br />
3<br />
<br />
3<br />
<br />
Chương 4: Phân loại dữ liệu<br />
4.1.<br />
<br />
Tổng quan về phân loại dữ liệu<br />
<br />
4.2.<br />
<br />
Phân loại dữ liệu với cây quyết định<br />
<br />
4.3.<br />
<br />
Phân loại dữ liệu với mạng Bayesian<br />
<br />
4.4.<br />
<br />
Phân loại dữ liệu với mạng Neural<br />
<br />
4.5.<br />
<br />
Các phương pháp phân loại dữ liệu<br />
<br />
4.6.<br />
<br />
Tóm tắt<br />
<br />
khác<br />
<br />
4<br />
<br />
4<br />
<br />
4.0. Tình huống 1<br />
Tid Refund<br />
<br />
Marital<br />
Status<br />
<br />
Taxable<br />
Evade<br />
Income<br />
<br />
1<br />
<br />
Yes<br />
<br />
Single<br />
<br />
125K<br />
<br />
No<br />
<br />
2<br />
<br />
No<br />
<br />
Married<br />
<br />
100K<br />
<br />
No<br />
<br />
3<br />
<br />
No<br />
<br />
Single<br />
<br />
70K<br />
<br />
No<br />
<br />
4<br />
<br />
Yes<br />
<br />
Married<br />
<br />
120K<br />
<br />
No<br />
<br />
5<br />
<br />
No<br />
<br />
Divorced 95K<br />
<br />
Yes<br />
<br />
6<br />
<br />
No<br />
<br />
Married<br />
<br />
No<br />
<br />
7<br />
<br />
Yes<br />
<br />
Divorced 220K<br />
<br />
No<br />
<br />
8<br />
<br />
No<br />
<br />
Single<br />
<br />
85K<br />
<br />
Yes<br />
<br />
9<br />
<br />
No<br />
<br />
Married<br />
<br />
75K<br />
<br />
No<br />
<br />
10<br />
<br />
No<br />
<br />
Single<br />
<br />
90K<br />
<br />
Yes<br />
<br />
60K<br />
<br />
Ông A (Tid = 100)<br />
có khả năng trốn<br />
thuế???<br />
<br />
10<br />
<br />
5<br />
<br />
5<br />
<br />