B GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
PHAN VĂN DƢƠNG
KHAI PHÁ D LIU VÀ NG DNG
TRONG TƢ VẤN TUYN SINH
TRƢỜNG CAO ĐNG NGH TRUNG B
Chuyên ngành : Khoa hc máy tính
s : 60.48.01
TÓM TT LUẬN VĂN THẠC SĨ K THUT
Đà Nẵng - Năm 2012
Công trình được hoàn thành ti
ĐẠI HỌC ĐÀ NẴNG
Người hướng dn khoa hc: PGS.TSKH. TRN QUC CHIN
Phn bin 1 : TS. NGUYN THANH BÌNH
Phn bin 2 : TS. LÊ XUÂN VINH
Luận văn được bo v ti Hội đồng chm Lun văn tốt
nghip thạc k thut hp ti Đại học Đà Nẵng vào ngày 19
tháng 01 năm 2013
Có th tìm hiu luận văn tại:
- Trung tâm Thông tin - Hc liu, Đại hc Đà Nẵng;
- Trung tâm Hc liu, Đại học Đà Nẵng;
1
M ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Trong vài thp niên gần đây, cùng với s thay đi phát trin
không ngng ca ngành công ngh thông tin, luồng thông tin được
chuyn ti mau l đến chóng mặt, ước tính c khoảng 20 tháng lượng
thông tin trên thế gii lại tăng gấp đôi. Vi s việc đó dẫn đến s
bùng n thông tin, m cho các nhà qun rơi vào tình trạng ngp
lut thông tin”. Chính vy, các chuyên gia cho rng, hin nay
chúng ta đang sống trong mt hội rt giàu v thông tin nhưng
nghèo v tri thc”. Những người ra quyết đnh trong các t chc i
chính, thương mại, khoa học…không mun b sót bt c thông tin
nào, h thu thập, u tr tt c mi thông tin cho rng trong n
cha nhng giá tr nhất định nào đó.
Trước tình hình đó, giải pháp hiu qu giúp phân ch khối lượng
ln d liu đó khai phá dữ liu. Vi k thut khai pd liu, tác
gi mun nghiên cu ng dng trong phân tích s liu tuyển sinh đ
phát hin nhng tri thc v công tác tư vấn tuyn sinh.
Hiện nay, lĩnh vực giáo dục đang phát triển mạnh mẽ, hệ thống
trường lớp đang ngày được mở rộng, kh năng cnh tranh thu hút
Học sinh - Sinh viên (HSSV) giữa các trường ngày một quyết liệt
hơn. Vì vậy, côngc tuyển sinh là một trong những vấn đề quan tâm
hàng đầu của c quan giáo dục, đã rất nhiều chương trình
vấn tuyển sinh rộng khp trên tất cả các tỉnh, thành trong cả nước với
nhiều hình thức phong phú. Tuy nhiên, thực tế thí sinh còn cảm thấy
thiếu thông tin về các trường, các nnh nghề mà mình quan m.
Vi mc đích trên, luận văn đi vào tìm hiu khai phá dữ liu y
dựng hệ thống hỗ trvấn tuyển sinh cho Trường Cao đẳng ngh
Cơ điện Xây dựng & Nông lâm Trung bộ.
2
2. MỤC ĐÍCH NGHIÊN CỨU
Mục đích của đề tài là tìm hiu các k thut khai phá d liu, ng
dng các k thut khai pd liu trong phân tích s liu tuyn sinh,
nhm phát hiện ra các đặc điểm chung ca HSSV trong vic la chn
Trường - Ngành Ngh hc tp, h tr Ban Tuyn Sinh nhng
nhận định và đề ra nhng bin pháp phù hp.
3. ĐỐI TƢỢNG VÀ PHM VI NGHIÊN CU
- Các k thut khai phá d liu.
- Mt s chương trình, mã ngun m ng dng khai phá d liu.
- Áp dng các thut toán khai phá d liu trên sở d liệu lưu
tr. (Hoạt đng nghiên cứu được khảo t trong lĩnh vực công tác
vn tuyn sinh).
4. PƠNG PHÁP NGHIÊN CỨU
- Phương pháp nghiên cứu thuyết: Tìm hiu la chn
phương pháp khai phá dữ liu thích hp.
- Thu thp thng kê s liu t ngun d liu công tác tuyn sinh.
- Phương pháp nghiên cứu thc nghim: Phân tích thiết kế h
thng, trin khai xây dng ng dng.
5. Ý NGHĨA ĐỀ TÀI
Ý nghĩa khoa học:
- Cung cp mt cách nhìn tng quan v phát hin tri thc và khai
phá d liu.
- Áp dng các thut toán khai phá d liu trên cơ sở d liu tuyn
sinh. (D liu thu thp t Trường Cao Đẳng Ngh Cơ Điện Xây
Dng & Nông m Trung B)
- Phát hiện ra các đặc đim chung ca HSSV h tr Ban Tuyn
Sinh có nhng nhận định c th và đề ra các gii pháp hu hiu.
3
Ý nghĩa thực tin:
- Chương trình được s dng cho Ban Tuyn Sinh nhm phát huy
hiu qu công tác tuyn sinh, h tr cho HSSV trong vic la chn
Trường - Ngành Ngh hc tp.
- Chương trình một gii pháp tin hc hóa trong công c tuyn
sinh. Gii pháp giúp to lp mt thng thông tin tích hp, phc v
hiu qu công tác tuyn sinh.
6. CU TRÚC LUẬN VĂN
Báo cáo ca luận văn được t chc thành 3 chương
CHƢƠNG 1
TNG QUAN KHO D LIU VÀ KHAI PHÁ D LIU
1.1 TNG QUAN V KHO D LIU
1.1.1 Định nghĩa kho dữ liu
Kho d liu là tuyn tập các cơ sở d liu tích hp, hướng ch đề,
được thiết kế để h tr cho chức năng tr giúp quyết định.
1.1.2 Mc đích kho dữ liu
- Đáp ứng mi yêu cu v thông tin của người s dng.
- H tr để các nhân viên ca các t chc thc hin hiu qu công
vic ca mình.
- Giúp các t chức, c đnh, quản lý, điu hành mt cách hiu
qu và chínhc.
- Tích hp d liu và các siêu d liu t nhiu ngun d liu.
Mun đạt được nhng yêu cu trên t DW phải đảm bo các mc
tiêu: Truy cp d dàng, thông tin nht quán, thích nghi vi s thay
đổi, h tr ra quyết đnh, bo mt.
1.1.3 Các đặc tính ca kho d liu