TRƯỜNG ĐẠI HC HÀNG HI VIT NAM
KHOA CÔNG NGH THÔNG TIN
THUYT MINH
ĐỀ TÀI NCKH CẤP TRƯỜNG
ĐỀ TÀI
NG DNG KHAI PHÁ D LIU
VÀO CÔNG TÁC QUN LÝ CÁN B TRƯỜNG ĐHHH
Ch nhim đề tài: NGUYN KIM ANH
Thành viên tham gia: TRNH TH NGỌC HƯƠNG
NGUYN TH THU HÀ
Hi Phòng, tháng 05/2015
Mc lc
Danh mc hình ................................................................................................................. 3
Li m đầu ....................................................................................................................... 4
Chương 1: Tổng quan v đề tài ....................................................................................... 5
1.1. Lý do chọn đề tài ................................................................................................ 5
1.2. Mc đích, phương pháp nghiên cu .................................................................. 5
1.3. Ni dung nghiên cu .......................................................................................... 5
Chương 2: Sơ lược v khai phá d liu ........................................................................... 6
2.1. Khái nim ............................................................................................................. 6
2.1.1. Qui trình Khai phá d liu .............................................................................. 6
2.1.2. Các bài toán thông dng trong Khai phá d liu ............................................ 8
2.2. Khai phá d liu vi bài toán phân lp ................................................................ 8
2.2.1.1. Quá trình phân lp ....................................................................................... 9
2.2.1.2. Chun b d liu cho quá trình phân lp ................................................... 10
2.3. Mô hình phân lp da trên cây quyết đnh ........................................................ 11
2.3.1. Cây quyết đnh .............................................................................................. 11
2.3.2. Thut toán xây dng cây quyết định ............................................................. 11
2.3.4. Ct ta cây quyết định ................................................................................... 17
2.4. Công c h try dng mô hình Weka ......................................................... 18
Chương 3: Quản lý cán bmô hình phân lp ........................................................... 24
3.1. Qun lý cán b ................................................................................................. 24
3.2. hình phân lp cán b ................................................................................. 25
3.3. Thc nghim ...................................................................................................... 27
3.3.1. Thiết kế CSDL mu ...................................................................................... 27
3.3.2. Xây dng cây quyết định .............................................................................. 28
3.3.3. Phn mm ng dng ..................................................................................... 29
Chương 4: Kết lun ....................................................................................................... 30
Tài liu tham kho ......................................................................................................... 31
Danh mc hình
Hình 1: Mô hình phân lp d liu ................................................................................... 8
Hình 2: Xây dng mô hình phân lp ............................................................................... 9
Hình 3: Ưc lượng độ chính xác ca mô hình ................................................................ 9
Hình 4: Phân lp d liu mi ........................................................................................ 10
Hình 5: Ví d cây quyết đnh ......................................................................................... 11
Hình 6: M file d liu mu trong Weka ....................................................................... 19
Hình 7: Chn thut toán phân lp vi Weka ................................................................. 20
Hình 8: Kết qu phân lp vi Weka .............................................................................. 21
Hình 9: La chn hin th cây quyết đnh ..................................................................... 22
Hình 10: Cây quyết định tuyn dng Nhân s ............................................................. 23
Hình 11: File d liu Excel ........................................................................................... 27
Hình 12: CSDL Nhân s trong SQL Server .................................................................. 28
Hình 13: Cây quyết định ng dng ............................................................................... 29
Li m đầu
Qun cán b công tác quan trng trong bt k mt t chc, doanh nghip
nào. Công tác y phi hp mt cách tng th nhiu hoạt động, bao gm: tuyn dng,
t chc, sp xếp cán bộ, đánh giá cán bộ, đào tạo, đề bt, b nhim, bổi dưỡng qun
lý... Trong đó, đánh giá h tuyển dng cán b công tác đầu tiên quan trng
xuyên sut quá trình công tác ca cán b; ch khi có đánh giá đúng thì mới th
sp xếp đúng và cán b đó mới có điều kiện phát huy được kh năng của mình.
Hiện nay đã rt nhiu sn phm phn mm h tr công tác qun nhân s,
nhưng hầu hết các sn phm này mi ch dng vic thu thp h lý lịch và in ra các
biu mu báo cáo phc v công tác qun lý, vic đánh giá cán b vn da vào cm tính
t đánh giá của nhân. Gi s, khi cp nht mt h nhân sự mi vào CSDL ta
th thc hin phân loi cho nhân s này mt cách t động thì việc đó thực s ý
nghĩa, hỗ tr cho vic đánh giá ban đầu v nhân s nhng định ng phát trin v
sau.
Dựa trên đặc điểm trong quá trình qun lý, vic cp nht, b sung, thay đi
thông tin nhân s diễn ra thường xuyên khiến cho d liệu được tích y ngày càng
nhiều, trong đó thể cha nhng thông tin ẩn dưới dng quy lut chưa được khai
phá, nhóm tác gi đã đề xut nghiên cứu đề tài "ng dng khai phá d liu trong
qun cán b trường ĐHHH". Đ tài tp trung nghiên cu thc hiện xây dưng
hình phân lp d liu nhân s nhm h tr quyết định đánh giá cán b da trên
những thông tin đã được lưu trữ.
Báo cáo gm các ni dung chính:
- Chương 1: Tng quan v đề tài Nêu lý do, mục đích phương pháp nghiên
cu thc hiện đề tài.
- Chương 2: c v khai phá d liu ng dng Khái nim, ng dng
mt s k thut khai phá d liệu điển hình.
- Chương 3: Qun cán b hình phân lp t bài toán qun cán
b và đề xut mô hình phân lp cán b da trên cây quyết định.
- Chương 4: Kết lun Đánh giá chung v đề tài và định hướng phát trin.
Thuyết minh ĐT NCKH Chương 1: TỔNG QUAN V ĐỀ TÀI
5
Chương 1: TNG QUAN V ĐỀ TÀI
1.1. Lý do chọn đềi
Qun lý cán b công tác quan trng trong bt k cơ quan tổ chc nào, ch khi
người qun th đưa ra những quyết định đúng trong lựa chọn đ tuyn dụng, đào
tạo, để đề bt, b nhim cán bộ… thì mới có th khai thác được năng lực cũng như to
điều kin cho cán b ca t chc phát trin.
Công tác qun cán b hiện nay đã được tin hc hóa vi khá nhiu sn phm
phn mm v qun nhân s, qun ngun nhân lc. Tuy nhiên chúng đu mt
đặc điểm là ch dng vic thu thp h sơ lý lch cán bin ra các biu mu báo cáo
phc v quản lý, công tác đánh giá cán bộ vn ch yếu thc hin th công da vào
cm tính t đánh giá của nhân để xem xét, th th phát sinh mt s tiêu
cc, làm suy gim sc mnh ca b máy qun lý.
trong quá trình qun cán b, h cán b luôn được cp nht, b sung,
thay đổi thông tin, d liệu được tích lũy ngày càng nhiều và có th trong đó chứa nhiu
thông tin n dng quy luật chưa được khai thác. Vic nghiên cu, ng dng các k
thut mi ca công ngh s d liu vào khai phá nhng thông tin tim n này là xu
th phát trin tt yếu.
1.2. Mục đích, phương pháp nghiên cứu
- Nghiên cu mt s k thut khai phá d liệu điển hình và ng dng.
- Tìm hiu mt s phn mm h try dng mô hình khai phá d liu.
- Xây dng được hình phân lp cán b nhm h tr công tác đánh giá
qun lý ngun nhân lực cho đơn v.
1.3. Ni dung nghiên cu
- Tìm hiu v khai phá d liu các k thut khai phá d liệu điển hình (phân
lp, chia cm).
- Tìm hiu công c xây dng hình khai phá d liu Business Intelligence ca
Microsoft.
- Cài đặt hình phân lp da trên y quyết định vi d liu là CSDL nhân s
trưng.