Giới thiệu tài liệu
Khả năng dự báo thành tích học tập tại thời điểm tốt nghiệp có tầm quan trọng sâu sắc đối với các trường đại học, đặc biệt là trong việc phân biệt các yếu tố ảnh hưởng đến xếp loại tốt nghiệp, góp phần nâng cao hiệu quả xếp loại và thu hút sinh viên. Việc sinh viên tốt nghiệp đúng hạn và đạt kết quả tốt nghiệp mong muốn không chỉ là mục tiêu cá nhân mà còn là ưu tiên hàng đầu của các cơ sở giáo dục. Nghiên cứu này tập trung vào việc ứng dụng máy học để dự đoán và phân loại tốt nghiệp của sinh viên, nhằm cung cấp cái nhìn sâu sắc về các yếu tố tác động và hỗ trợ các quyết định quản lý giáo dục hiệu quả.
Đối tượng sử dụng
Các nhà quản lý giáo dục, hoạch định chính sách, giảng viên và nhà nghiên cứu trong lĩnh vực giáo dục đại học và khoa học dữ liệu, đặc biệt quan tâm đến việc ứng dụng máy học để nâng cao chất lượng đào tạo và hỗ trợ sinh viên.
Nội dung tóm tắt
Nghiên cứu này khai thác tiềm năng của máy học trong việc dự đoán kết quả tốt nghiệp và phân loại tốt nghiệp cho sinh viên đại học. Sử dụng bộ dữ liệu gồm 1.817 sinh viên đã tốt nghiệp tại Trường Đại học Kỹ thuật - Công nghệ Cần Thơ từ năm 2022 đến 2024, công trình này áp dụng nhiều thuật toán học máy tiên tiến như K-Nearest Neighbor, Decision Tree, Random Forest, Logistic Regression, Support Vector Machine và Recurrent Neural Network. Dữ liệu thô được tiền xử lý chi tiết, bao gồm chuyển đổi các biến như tuổi và nơi sinh, cũng như xử lý mất cân bằng lớp bằng kỹ thuật Oversampling (SMOTE) để đảm bảo độ tin cậy. Các kết quả thực nghiệm cho thấy mô hình Decision Tree và Random Forest mang lại hiệu suất vượt trội, với độ chính xác lần lượt đạt 99,78% và 99,34%. Đặc biệt, Decision Tree cho thấy thời gian huấn luyện nhanh chóng. Nghiên cứu cũng xác định các yếu tố quan trọng ảnh hưởng đến xếp loại tốt nghiệp, trong đó điểm trung bình tích lũy là yếu tố chiếm ưu thế nhất (77%), tiếp theo là giới tính, nơi sinh, tuổi, ngành và số tín chỉ tích lũy. Các yếu tố ít ảnh hưởng như dân tộc và loại tốt nghiệp có thể được loại bỏ để tối ưu hóa mô hình. Những phát hiện này cung cấp thông tin giá trị cho các trường đại học, giúp họ đưa ra các quyết định sáng suốt để cải thiện chất lượng đào tạo và hỗ trợ sinh viên, cũng như nâng cao công tác phân loại tốt nghiệp.