
1
TÓM TẮT LUẬN VĂN
Trong những năm gần đây, kì thi tốt nghiệp trung học phổ thông quốc gia
thường xuyên được đổi mới về hình thức thi và nội dung đề thi. Do đó, giáo viên, phụ
huynh và học sinh khối 12 ở các trường phổ thông càng quan tâm hơn nữa đến vấn đề
học sinh được bao nhiêu điểm khi thi, liệu với những điểm đó có thể xét được các
trường đại học nào… Vấn đề tiên đoán số điểm thi, các giáo viên giảng dạy trực tiếp
có thể đoán được dựa trên năng lực học tập của các em hoặc các bậc phụ huynh sẽ đi
xem bói để nghe thầy bói phán mà không có cơ sở khoa học nào, đôi khi dựa trên cảm
tính.
Ở lĩnh vực dự đoán, có rất nhiều mô hình sử dụng các kĩ thuật khác nhau như
Weka, logic mờ, rừng ngẫu nhiên hồi quy… Rừng ngẫu nhiên là một phương pháp học
tập chung để phân loại, hồi quy và các nhiệm vụ khác hoạt động bằng cách xây dựng
vô số cây quyết định tại thời điểm đào tạo và đưa ra phân lớp (phân loại) hoặc dự đoán
trung bình (hồi quy) của các cây riêng lẻ. Kể từ khi được giới thiệu bởi Breiman
(2001), kĩ thuật rừng ngẫu nhiên đã thành công như một phương pháp phân loại và hồi
quy có độ chính xác khá cao, được áp dụng vào nhiều mô hình tiên đoán.
Trong đề tài luận văn này, tôi đề xuất một mô hình tiên đoán điểm thi tốt nghiệp
trung học phổ thông quốc gia cho học sinh. Mô hình lấy điểm tổng kết các môn có
tham gia thi để làm tập huấn luyện và tập kiểm thử trong kĩ thuật rừng hồi quy ngẫu
nhiên để đưa ra các điểm dự đoán. Sau đó tiếp tục xây dựng hệ thống dự đoán điểm
trên website để người dùng có thể nhập và dự đoán dựa vào mô hình đã xây dựng ở
trên.