Trịnh Tấn Đạt
Khoa CNTT Đại Học Sài Gòn
Email: trinhtandat@sgu.edu.vn
Website: https://sites.google.com/site/ttdat88/
1
Nội dung
Giới thiệu môn học
Các nội dung
Tài liệu tham khảo
Hình thức đánh giá
Danh sách các đề tài đồ án môn học
Các vấn đề trong data mining
Trao đổi thảo luận
2
Giới Thiệu Môn Học
Khai phá dữ liệu (data mining)
3 tín chỉ
Mục tiêu:
Cung cấp cho sinh viên các nguyên , các khái niệm, và các kỹ thuật căn bản
nền tảng trong khai phá dữ liệu
Giới thiệu cho sinh viên những hiểu biết nhất định về các chủ đề khai phá dữ liệu
mới mẻ hiện đại cũng như các xu hướng của lĩnh vực.
Cung cấp nền tảng tốt về suy luận thống kê và cấu trúc toán học cần thiết để phục
vụ cho công việc nghiên cứu khoa học.
Kỹ năng thực hành, thiết kế phỏng thực nghiệm.
Thái độ học tập chăm chỉ, nghiêm túc và sáng tạo.
3
Các Nội Dung
Giới thiệu về khai phá dữ liệu các vấn đề liên quan
Tiền xử dữ liệu (preprocessing)
Hồi quy dữ liệu (regression)
Các phương pháp phân lớp (classification): Naïve Bayes Classifier, Neural
Network, SVM, Boosting…
Các phương pháp phân cụm (clustering): Kmeans, Phân cụm đa cấp, …
Luật kết hợp (association rules)
Đồ án môn học seminar nhóm
4
Tài liệu tham khảo
Slide giảng viên cung cấp
Jiawei Han, Micheline Kamber, and Jian Pei, Data Mining: Concepts and Techniques,
3rd edition, Morgan Kaufmann Publishers, 2011
Ian H. Witten and Eibe Frank, Data Mining Practical Machine Learning Tools and
Techniques, 2nd edition, Morgan Kaufmann Publishers, 2005
Richard O. Duda, Peter E. Hart, and David G. Stork, Pattern Classification,
Wiley,2000.
Các nguồn khác trên internet
Google
Kaggle
5