Hệ thống gợi ý hỗ trợ tuyển dụng và ứng tuyển ngành công nghệ thông tin

Chia sẻ: Bigates Bigates | Ngày: | Loại File: PDF | Số trang:7

Thêm vào BST

Báo xấu

27
lượt xem 2
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong tuyển dụng, hàng ngày nhà tuyển dụng nhận được rất nhiều hồ sơ ứng tuyển. Để có thể tìm được hồ sơ phù hợp, nhà ứng tuyển mất khá nhiều thời gian tìm và lọc hồ sơ. Một website tuyển dụng truyền thống chỉ dựa vào một số thuộc tính mà người dùng chọn lựa trên thanh tìm kiếm để trả về kết quả.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Hệ thống gợi ý hỗ trợ tuyển dụng và ứng tuyển ngành công nghệ thông tin

HỆ THỐNG GỢI Ý HỖ TRỢ TUYỂN DỤNG VÀ ỨNG TUYỂN NGÀNH CÔNG NGHỆ THÔNG TIN Phạm Mai Hương, Trương Văn Ninh Khoa Công nghệ Thông tin, Trường Đại học Công nghệ TP. Hồ Chí Minh GVHD: ThS. Võ Hoàng Khang TÓM TẮT Trong tuyển dụng, hàng ngày nhà tuyển dụng nhận được rất nhiều hồ sơ ứng tuyển. Để có thể tìm được hồ sơ phù hợp, nhà ứng tuyển mất khá nhiều thời gian tìm và lọc hồ sơ. Một website tuyển dụng truyền thống chỉ dựa vào một số thuộc tính mà người dùng chọn lựa trên thanh tìm kiếm để trả về kết quả. Để tăng tính hiệu quả của website, ngoài việc dựa vào những thuộc tính mà người dùng lựa chọn trên thanh công cụ, còn dựa vào những thông tin mà người dùng cung cấp qua việc điền hồ sơ để tiến hành lọc danh sách tin tuyển dụng cho phù hợp với mong muốn của từng ứng viên. Từ khóa: gợi ý, kết nối, nhà tuyển dụng, tuyển dụng, ứng viên. 1 GIỚI THIỆU 1.1 Tổng quan về hệ thống gợi ý Hệ thống gợi ý là một dạng của hệ hỗ trợ ra quyết định, cung cấp giải pháp mang tính cá nhân hóa mà không phải trải qua quá trình tìm kiếm phức tạp. Hệ gợi ý học từ người dùng và gợi ý các sản phẩm tốt nhất trong số các sản phẩm phù hợp. Hệ thống gợi ý sử dụng các tri thức về sản phẩm, các tri thức của chuyên gia hay tri thức khai phá học được từ hành vi con người dùng để đưa ra các gợi ý. 1.2 Các phương pháp gợi ý chủ yếu Gợi ý dựa theo lọc cộng tác, gợi ý dựa theo nội dung, gợi ý dựa trên sự tương đồng. 2 CÁC BƯỚC TIẾN HÀNH 2.1 Thu thập dữ liệu - Thông tin ứng viên lấy từ CV có sẵn, về sở thích, kỹ năng, công việc đã làm... - Thông tin công việc lấy từ các website tuyển dụng. 2.2 Chọn các thuộc tính - Ứng viên: tuổi, giới tính, tình trạng hôn nhân, bằng cấp, điểm số, ngành, kinh nghiệm, kỹ năng... - Thông tin công việc: bằng cấp, kinh nghiệm, kỹ năng, thông tin nhà tuyển dụng, lĩnh vực... 71
2.3 Phân loại dữ liệu Ứng viên (6 nhóm): giới tính (2 nhóm), tình trạng hôn nhân (3 nhóm), bằng cấp (4 nhóm), điểm số (3 nhóm), chuyên ngành (8 nhóm), kinh nghiệm (6 nhóm), kỹ năng, vị trí địa lý (5 nhóm). Nhà tuyển dụng (4 nhóm): lĩnh vực (8 nhóm), vị trí tuyển dụng (4 nhóm), mức lương (3 nhóm), vị trí địa lý (5 nhóm), xếp hạng nhà tuyển dụng (5 nhóm). 2.4 Khai phá dữ liệu và tìm luật kết hợp với thuật toán Apriori Bước 1: áp dụng thuật toán Apriori để khai phá luật kết hợp dựa vào các thuộc tính của ứng viên để tìm ra các tập phổ biến của ứng viên từ đó có thể đưa ra được xu hướng lựa chọn công việc của các tập ứng viên. (Ví dụ: Những ứng viên trên 30 tuổi thường đã kết hôn và kinh nghiệm lớn hơn 4 năm thường có xu hướng chọn những công việc có mức thu nhập cao để lo cho gia đình, con cái.) Item: tuổi, kinh nghiệm, giới tính, tình trạng hôn nhân, điểm, vị trí địa lý của tất cả các ứng viên. Itemset: danh sách các Item của ứng viên. Transaction: tập hợp các Itemset của ứng viên. Với: min_confidence là 80% và min_support = 50%. Bước 2: sau đó xây dựng 1 ma trận đơn vị giữa các luật kết hợp tìm được và tất cả các công việc sao cho: Matrix [i, j] = 1 (nếu công việc j có tồn tại trong luật thứ i) (ngược lại = 0) => ma trận yêu thích Bước 3: dựa vào ma trận yêu thích tìm được, tính ma trận trọng số cho tất cả các nhóm luật với từng thuộc tính: vị trí tuyển dụng (4 gr), mức lương (3 gr), xếp hạng nhà tuyển dụng (5 gr) cách tính: a) Tính véc tơ trọng số cho các thuộc tính vị trí tuyển dụng (4 gr), mức lương (3 gr), xếp hạng nhà tuyển dụng (5 gr) với mỗi nhóm luật dựa trên ma trận yêu thích. Ví dụ: trong nhóm luật 1 có n công việc ta tính vecto trọng số cho vị trí tuyển dụng [A,B,C,D]. Với nA là số lần xuất hiện của A trong n công việc ta có: pA=nA/n, P(1) = [pA pB pC pD], P(n) = [pA pB pC pD], với P(n): vecto trọng số cho vị trí công việc trong nhóm n. b) Đưa ra 1 ma trận trọng số cho vị trí tuyển dụng (V) với tất cả các nhóm luật. Matrix [i, j] = p(i,j) (trọng số của vị trí thứ j trong nhóm luật thứ i); i: n nhóm luật; j: 4 nhóm trong vị trí[A,B,C,D] c) Làm tương tự ta được ma trận trọng số cho mức lương (L), xếp hạng nhà tuyển dụng (R). 2.5 Tiến hành các bước thực hiện để đưa ra gợi ý 2.5.1 Lọc những ứng cử viên phù hợp với những thuộc tính ưu tiên Các trường được xem xét cho việc lọc danh sách các công việc thích hơp (danh sách thu gọn) là: trình độ chuyên môn, bằng cấp tối thiểu và kinh nghiệm tối thiểu. Điều này được thực hiện để thu gọn danh sách công việc phù hợp và giảm bớt thời gian xử lý các công việc không liên quan đến ứng viên. Vì xét tất cả các công việc đối với lọc dựa trên nội dung, dẫn đến độ phức tạp về thời gian cao hơn trong trường hợp tập dữ liệu lớn. 72
H nh 1. Lọc những ứng cử viên phù hợp với những thuộc tính cơ bản 2.5.2 Tính toán độ giống nhau giữa kỹ năng ứng viên và kỹ năng nhà tuyển dụng yêu cầu Bây giờ hãy tính toán độ giống nhau cho các công việc trong danh sách thu gọn liên quan đến ứng cử viên. Độ giống nhau được tính toán giữa các trường kỹ năng yêu cầu của công việc và của ứng viên. Ở đây độ giống nhau về cosine giữa hai trường kỹ năng trên được xem xét theo công thức Cosine similarity: Cosine similarity (a, b) = (a . b) / (|a| |b|). Độ giống nhau cosin càng lớn thì mức độ tương đồng giữa các trường càng cao, suy ra kỹ năng của ứng viên càng phù hợp với kỹ năng nhà tuyển dụng yêu cầu. Biểu diễn vecto kỹ năng: - Đầu tiên, vectơ ma trận cho yêu cầu kỹ năng công việc của nhà tuyển dụng được tạo ra với số chiều tương ứng với số kỹ năng yêu cầu, trọng số là 1 cho tất cả các trường (không yêu cầu mức độ thông thạo). - Sau đó, vectơ kỹ năng của ứng cử viên được tạo ra, sao cho số chiều bằng với vecto kỹ năng nhà tuyển dụng. Với những kỹ năng tương đồng sẽ có trọng số là 1 và không tương đồng sẽ có trọng số 0. H nh 2. Tính toán độ giống nhau 2.5.3 Tính trọng số về độ yêu thích của ứng viên đối với công việc dựa vào ma trận yêu thích Với ma trận trọng số tìm được cho: vị trí, mức lương, xếp hạng nhà tuyển dụng. Ta tìm trọng số cho mỗi công việc trong danh sách thu gọn ứng viên sao cho: 73
rwi = w(V) + w(L) + w(R), với w(V) là trọng số cả công việc j trong ma trận trọng số vị trí td(V), w(L) là trọng số cả công việc j trong ma trận trọng số mức lương (L) và w(R) là trọng số cả công việc j trong ma trận trọng số xếp hạng nhà tuyển dụng (R). H nh 3. Ứng dụng luật kết hợp và cây quyết định để phân loại ứng viên 2.5.4 Tính toán tổng trọng số Bây giờ hãy tính điểm trọng số cuối cùng bằng cách tính tổng các giá trị của độ tương tự cosin và trọng số về mức độ yêu thích theo công thức Final Weight (Final Weight(i) (Tổng trọng số) = w1 . simi + w2 . rwi). Ở đây cả tính độ tương tự cosine cũng như trọng số trọng số về mức độ yêu thích đều có trọng số như nhau. Việc chỉ định trọng số không phù hợp cho chúng dẫn đến kết quả mơ hồ vì trọng số cao hơn của một bên sẽ lấn át mức độ ưu tiên của bên kia và do đó gây ra sự mơ hồ trong kết quả. Quản lý website được quyền chọn thông số cho w1, w2 sao cho w1 + w2 = 1 dựa vào mức độ ưu tiên của hệ thống (ưu tiên phù hợp về kỹ năng hoặc ưu tiên dựa trên mức độ yêu thích của ứng viên). H nh 4. Tính toán tổng trọng số 2.5.5 Sắp xếp và đưa ra gợi ý Theo điểm số cuối cùng thu được, hãy sắp xếp các công việc theo thứ tự giảm dần, tức là công việc với điểm tối đa có trọng số cuối cùng ở vị trí 1 và công việc có trọng số cuối cùng ít nhất điểm cuối cùng. H nh 5. Sắp xếp công việc theo trọng số và tiến hành gợi ý 74
2.6 Công thức Cosine similarity (a, b) = (a . b) / (|a| |b|), Final Weight(i) (Tổng trọng số) = w1 . simi + w2. rwi Trong đó i đại diện cho công việc trong danh sách lựa chọn thứ i, simi là viết tắt của cosine tương tự cho công việc thứ i, rwi đại diện cho trọng số quy tắc được chỉ định cho công việc thứ i, w1 và w2 đại diện cho trọng số được chỉ định theo độ ưu tiên. 3 THỰC NGHIỆM Áp dụng khai phá luật kết hợp để biểu diễn ma trận các quy tắc đã khai phá với các danh mục công việc khác nhau. Tìm luật kết hợp với Apriori với min_support = 50% và min_confident = 80%. Để đưa ra ma trận mối quan hệ như sau: Giải thích: những người nhóm tuổi từ A, kinh nghiệm E2 thường chọn những công việc J1, J3… Bước 1: lọc những ứng cử viên phù hợp dựa trên các tiêu chí chính. Ví dụ: thông tin ứng viên: {F, I2, E3, G3, U, H1, M1, Q6, C++ Oracle Algorithms English Js}. Job Qualification Major Experience J1 Q1 M1 E2 J2 Q2 M2 E6 J3 Q3 M3 E2 J4 Q4 M1 E3 75
Job Qualification Major Experience J5 Q1 M4 E5 J6 Q1 M5 E2 J7 Q3 M1 E3 J8 Q3 M8 E3 J9 Q2 M1 E6 J10 Q2 M1 E4 Sau khi lọc ta được bảng thu gọn gồm J1, J2, J4, J6, J7, J8 phù hợp với profile ứng viên. Bước 2: tính độ tương đồng về kỹ năng Candidate Job Skill Skill Vector Cosin Similirity Vector MySQL, PHP, Data J1 [1,1,1,1] [0,0,0,1] 0.5 structure, English. OpenCL, Networking, J2 [1,1,1,1] [0,0,1,0] 0.866 English, German. C++, SQL, Algorithm, J7 [1,1,1,1,1] [1,0,1,1,1] 0.894 JS, English. C++, Oracle, Algorithms, J9 [1,1,1,1,1] [1,1,1,1,0] 0.894 English, JAVA. HTML, CSS, Data J10 Structure, Algorithm, [1,1,1,1,1] [0,0,0,1,1] 0.63 English. Bước 3: áp dụng khai phá luật kết hợp để phân loại ứng viên. Ví dụ với ứng viên: {F, I2, E3, G3, U, H1, M1, Q6, C++ Oracle Algorithms English Js}. Dựa vào ma trận khai phá ta có: F tuổi, kinh nghiệm E6 năm thường hay chọn các công việc: J2, J9. Ta có ma trận khai phá sau: Company Ranking [R1, R2, R3, R4, R5] = [0, 0, ½, 0, ½] Impotant position [ID1, ID2, ID3, ID4] = [0, 1, 0, 0]; Pay scale [P1, P2, P3] = [0, ½, ½] Ta có Rules Weight bằng tổng của các tham số tương ứng với ma trận ví dụ: Company Rank là R1, Impotant postion là ID1, Pay scale là P3: rwi = {0 + ½ + 0} = ½ Bước 4: tính toán tổng trọng số. - Normalized Weight= (W i - Wmin) / (Wmax - Wmin) (Chuẩn hóa dữ liệu) - Tính tổng trọng số (Final Weight (i)) (chọn w1 = w2 = 0.5). Normalized Cosin Company Important Pay Final Job Rules Weight Rules Similarity Ranking Position Scale Weight Weight J2 0.866 R3 ID2 P2 {½+1+½} = 2 1 0.933 J9 0.894 R5 ID2 P3 {½+1+½} = 2 1 0.947 76
Bước 5: sắp xếp theo tổng trọng số và đưa ra gợi ý. Kết quả: thứ tự gợi ý sẽ là {J9, J2}. 4 KẾT LUẬN VÀ KIẾN NGHỊ 4.1 Kết luận Hệ thống gợi ý được xây dựng cơ bản hoàn thiện về cơ sở lý thuyết. Thông tin được sắp xếp và lưu trữ có hệ thống. Áp dụng khai phá luật kết hợp vào trong quá trình đưa ra gợi ý. Thuật toán đưa ra gợi ý dựa vào hai yếu tố: độ phù hợp kỹ năng của ứng viên với công việc, mức độ tương đương giữa các ứng viên được khai phá dựa trên các luật kết hợp giúp cho quá trình tuyển dụng thực tế khách quan. 4.2 Kiến nghị Để thuật toán đưa ra gợi ý một cách hiệu quả cần một số lượng dữ liệu đủ lớn để áp dụng khai phá luật kết hợp. Việc xác định các chỉ số đầu vào của thuật toán sẽ ảnh hưởng đến toàn bộ quá trình gợi ý, do đó nên cân nhắc và đưa ra những chỉ số phù hợp giúp hệ thống hoạt động hiệu quả nhất. TÀI LIỆU THAM KHẢO Online document (Tài liệu trực tuyến): [1] Khóa học Khai phá dữ liệu, trường ĐH. Khoa học Tự nhiên, ĐH Quốc gia TP.HCM. [2] Khóa học online Machine Learning with Andrew Ng. Book (Sách): [3] M.J. Pazzani, “A framework for collaborative, content-based and demographic filtering”, Artific Intell Rev, 13 (1999), pp. 393-408. Journal article (Bài báo): [4] https://gdeepak.com/thesisme/Applying%20Data%20Mining%20For%20Job%20Reco mmendations.pdf 77