
1
ĐỀ TÀI
PHƯƠNG PHÁP SỬ DỤNG CNTT ĐỂ DỰ ĐOÁN KẾT QUẢ THI TN/THPT
CHO HỌC SINH TẠI TRƯỜNG THPT TÂY HIẾU – THPT 1/5
Phần 1: Đặt vấn đề
1. Sự cần thiết của vấn đề nghiên cứu
Nghị quyết 29-NQ/TW, Đảng CSVN lần thứ XI (2013) “Về đổi mới căn
bản, toàn diện giáo dục và đào tạo, đáp ứng yêu cầu công nghiệp hóa, hiện đại
hóa trong điều kiện kinh tế thị trường định hướng xã hội chủ nghĩa và hội nhập
quốc tế" đã xác định mục tiêu tổng quát của “Đổi mới căn bản và toàn diện giáo
dục và đào tạo" là “Tạo chuyển biến căn bản, mạnh mẽ về chất lượng, hiệu quả
giáo dục, đào tạo; đáp ứng ngày càng tốt hơn công cuộc xây dựng, bảo vệ Tổ
quốc và nhu cầu học tập của nhân dân...”. Nghị quyết 29 cũng xác định rõ một
trong các nhiệm vụ và giải pháp hàng đầu là “Đổi mới căn bản công tác quản lý
giáo dục, đào tạo, bảo đảm dân chủ, thống nhất; tăng quyền tự chủ và trách nhiệm
xã hội của các cơ sở giáo dục, đào tạo; coi trọng quản lý chất lượng”. Trong bối
cảnh đổi mới chung này, giáo dục trung học phổ thông phải được đổi mới mạnh
mẽ, không ngừng nâng cao chất lượng giáo dục - dạy học vì đây là cấp học nền
tảng để học sinh tiếp tục học nghề hay chuyên môn sâu ở cấp cao hơn.
Hàng năm, Bộ GD&ĐT cũng như Sở GD&ĐT tổ chức nhiều đợt tập huấn để
giáo viên các trường có môi trường học tập nâng cao trình độ, trao đổi kinh
nghiệm với giáo viên các trường bạn, qua đó giúp giáo viên có điều kiện trao đổi,
học hỏi lẫn nhau, hỗ trợ nhau thường xuyên trong quá trình dạy học, tổ chức dự
giờ trực tuyến, … Dựa vào các đợt tập huấn này, chất lượng dạy học ngày càng
được cải thiện. Thông thường, nội dung các đợt tập huấn này áp dụng đại trà cho
nhiều trường học và nhiều giáo viên.
Là giáo viên THPT tôi luôn luôn tự đặt ra các câu hỏi và giải đáp các câu hỏi
đó: Làm thế nào để có một phương pháp giảng dạy học linh hoạt và hấp dẫn
người học; làm thế nào để học sinh yêu thích môn học; làm thế nào để khơi dậy

2
mong muốn học tập và tìm hiểu kiến thức của người học; làm thế nào để tăng
hiệu quả trong các tiết dạy, trong các môn học; làm thế nào để dạy học gắn liền
với thực tiễn, làm thế nào để giúp học sinh biết được khả năng của mình đúng với
năng lực sắn có từ đó giúp các em chọn hướng phù hợp cho tương lai theo đúng
khả năng của mình … Đây là một vấn đề bức bách của những người làm giáo dục
và của đất nước trong giai đoạn hiện nay. Hơn thế nữa, trong xã hội hiện đại này,
để đáp ứng nhu cầu nguồn nhân lực lao động chất lượng cao cho đất nước, người
lao động không chỉ có các kiến thức chuyên môn, ngoại ngữ, tin học mà còn phải
có các kỹ năng, một số hiểu biết về xã hội cũng như kỹ năng phát hiện và giải
quyết vấn đề, kỹ năng giao tiếp, kỹ năng làm việc theo nhóm, kỹ năng sử dụng
công nghệ thông tin,…
Câu hỏi đặt ra là “Làm thế nào để giúp học sinh đánh giá đúng năng lực học
tập của mình một cách khoa học gắn liền với thực tiễn, giúp học sinh yên tâm để
chọn con đường đi cho tương lai, quyết định học lên Đại học hay học nghề sau
khi kết thúc cấp học THPT ?”.
Trước thực tế đó, chúng tôi chọn đề tài “Phương pháp sử dụng CNTT để
dự đoán kết quả thi TN/THPT cho học sinh tại trường THPT Tây Hiếu –
THPT 1/5” sẽ đáp ứng được các yêu cầu và mong muốn trên, góp thêm một phần
nhỏ trong việc áp dụng kỹ thuật Khai phá dữ liệu trong giáo dục nhằm có những
định hướng tốt cho học sinh, giáo viên và lãnh đạo trường THPT nói chung và
Trường THPT Tây Hiếu, THPT 1/5 nói riêng.
Đề tài nghiên cứu áp dụng các kỹ thuật khai phá dữ liệu trên tập dữ liệu thu
thập được tại Trường THPT Tây Hiếu, thị xã Thái Hòa và trường THPT 1/5, huyện
Nghĩa Đàn. Dựa vào kết quả của quá trình phân tích dữ liệu này sẽ giúp học sinh
biết được khả năng của mình để kịp thời điều chỉnh, tự bồi dưỡng, học thêm các
môn học còn yếu. Ngoài ra, việc này còn giúp cho học sinh định hướng lựa chọn
các trường đại học phù hợp với khả năng của mình. Thêm vào đó, việc dự đoàn kết
quả này còn giúp cho các nhà trường có thể điều chỉnh kế hoạch dạy học phù hợp
với các đối tượng học sinh cuối cấp học.

3
Chúng tôi hi vọng đề tài phần nào đó có thể giúp học sinh, giáo viên cũng
như các trường THPT có được các định hướng phù hợp góp phần đổi mới căn
bản, toàn diện giáo dục đào tạo và nâng cao vị thế của trường.
2. Mục tiêu nghiên cứu
2.1. Mục tiêu tổng quát
Tìm hiểu tổng quan về các kỹ thuật khai phá dữ liệu áp dụng dự đoán kết
quả kỳ thi THPT quốc gia cho học sinh Trường THPT Tây Hiếu, học sinh trường
THPT 1/5.
2.2 . Mục tiêu cụ thể
Đề tài sẽ tập trung vào các mục tiêu cụ thể như sau:
- Thu thập dữ liệu về học sinh Trường THPT Tây Hiếu, thị xã Thái Hòa, tỉnh
Nghệ An và học sinh trường THPT 1/5, huyện Nghĩa Đàn, tỉnh Nghệ An;
- Tìm hiểu các nghiên cứu liên quan đến đề tài trong và ngoài nước;
- Nghiên cứu kỹ thuật khai phá dữ liệu và các thuật toán phân lớp, phân cụm;
- Phân tích kết quả dựa trên các tập dữ liệu đã thu thập sử dụng các kỹ thuật
khai phá dữ liệu;
- Nhận xét, đánh giá và kiến nghị dựa trên kết quả đã phân tích nhằm giúp
học sinh, giáo viên và nhà trường có một kết quả dự báo mang tính khoa học về
học sinh tham dự kỳ thi THPT quốc gia và từ đó có thể làm căn cứ để định hướng
cho học sinh sau khi kết thúc cấp học.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
- Dữ liệu thu thập từ học sinh và giáo viên Trường THPT Tây Hiếu và trường
THPT 1/5;
- Các thuật toán khai phá luật kết hợp và phân lớp;
- Các công cụ khai phá dữ liệu.
3.2. Phạm vi nghiên cứu

4
- Đề tài sử dụng thông tin dữ liệu về học sinh Trường THPT Tây Hiếu,
THPT 1/5 trong 3 năm gần nhất;
- Nghiên cứu các kỹ thuật khai phá luật phân lớp và phân cụm để thực hiện
các yêu cầu đặt ra.
4. Nội dung nghiên cứu
- Thu thập dữ liệu về học sinh Trường THPT Tây Hiếu, thị xã Thái Hòa, tỉnh
Nghệ An và trường THPT 1/5 huyện Nghĩa Đàn ;
- Nghiên cứu lý thuyết về khai phá dữ liệu, cụ thể là các giải thuật khai phá
luật phân lớp và phân cụm;
- Tìm hiểu các công trình nghiên cứu liên quan đến đề tài;
- Ứng dụng các kỹ thuật khai phá dữ liệu trên tập dữ liệu đã thu thập;
- Sử dụng ngôn ngữ lập trình Python và một số công cụ khai phá dữ liệu để
tiến hành thực nghiệm;
- Nhận xét, đánh giá và phân tích những kết quả thu được từ tập dữ liệu.
Phần II. Nội dung nghiên cứu:
1. Khai phá dữ liệu
Quá trình khai phá dữ liệu kết xuất ra các tri thức tiềm ẩn trong dữ liệu giúp
cho việc phân tích, dự báo áp dụng cho nhiều ngành, nhiều lĩnh vực như kinh
doanh hay giáo dục. Chương này trình bày các khái niệm cơ bản về khai phá dữ
liệu trong giáo dục; nhu cầu khai phá dữ liệu trong giáo dục và đào tạo cũng như
một số lĩnh vực khác; các giai đoạn chính trong khai phá dữ liệu và một số bài
toán điển hình trong khai phá dữ liệu như kỹ thuật phân lớp (classification) và
phân cụm (clustering). Ngoài ra, chương này còn trình bày thực trạng bài toán
Dự đoán kết quả kỳ thi THPT quốc gia bằng kỹ thuật Khai phá dữ liệu, các
nghiên cứu liên quan đến đề tài trong và ngoài nước cũng như các bước thu thập
dữ liệu về học sinh phục vụ cho việc phân tích dựa vào các kỹ thuật khai phá dữ
liệu đã đề cập.

5
1.1. Khai phá dữ liệu trong giáo dục
Ngày nay, công nghệ thông tin phát triển mạnh mẽ và việc ứng dụng công
nghệ thông tin trong nhiều lĩnh vực đời sống, kinh tế xã hội đã làm lượng dữ liệu
được thu thập và lưu trữ ở các hệ thống thông tin tăng lên một cách nhanh chóng.
Trước tình hình đó, việc khai thác và chọn lọc những dữ liệu có ích từ lượng
dữ liệu khổng lồ đó là việc cần thiết, đóng vai trò quyết định thành công trong mọi
hoạt động. Các dữ liệu chắt lọc đó sẽ giúp cải thiện hoạt động trong hiện tại hay
đặt ra những dự đoán giúp việc đưa ra quyết định trong tương lai sẽ chính xác hơn.
Với những lý do đó, nhu cầu phát triển các kỹ thuật thu thập, lưu trữ, phân tích dữ
liệu, ... được đặt ra và nó đòi hỏi phải được xử lý thông minh và hiệu quả hơn. Từ
đó đã làm phát triển kỹ thuật mới và với kỹ thuật này cho phép ta khai thác được
tri thức hữu dụng từ cơ sỡ dữ liệu lớn được gọi là các kỹ thuật khai phá dữ liệu
(Data Mining - DM).
Các kỹ thuật khai phá dữ liệu được ứng dụng trong nhiều lĩnh vực như: kinh
tế, tài chính, y tế, giáo dục... Trong việc ứng dụng khai phá dữ liệu vào nhiều lĩnh
vực khác nhau của đời sống, khai phá dữ liệu trong lĩnh vực giáo dục đang dần có
được sự quan tâm đúng mức. Chúng ta cần phải nhìn nhận rằng giáo dục là nhân tố
quyết định sự phát triển của đất nước về nhiều mặt. Mục tiêu phát triển xã hội một
cách bền vững đang đặt ra cho giáo dục những yêu cầu mới.
Giáo dục đào tạo có nhiệm vụ định hướng và hoạch định chính sách cho đối
tượng chính của giáo dục là thế hệ trẻ, là lực lượng kế thừa của việc xây dựng, bảo
vệ và phát triển đất nước trong tương lai một cách đúng đắn và kịp thời.
Chính vì vậy, việc định hướng và xây dựng chính sách trong giáo dục đào tạo
cần phải được hỗ trợ bởi các công cụ khoa học để tránh những sai lầm đáng tiếc.
Trong số những công cụ đó, khai phá dữ liệu là một công cụ hữu ích và có tính
khoa học cao, giúp các nhà quản lý giáo dục có được những tri thức quý giá phục
vụ cho công tác quản lý và học sinh, sinh viên cũng có thể sử dụng những kết quả
hữu ích từ quá trình chắt lọc dữ liệu trong khai phá dữ liệu.

