
201
TÁC ĐỘNG CỦA CHATGPT TRONG ĐÁNH GIÁ TRỰC TUYẾN:
TIỀM NĂNG VÀ THÁCH THỨC ĐỐI VỚI GIÁO DỤC ĐẠI HỌC TỪ XA
Cao Việt Hiếu1, Dương Thanh Linh,1 Nguyễn Thị Minh Phương1
Email: minhphuong@bdu.edu.vn
Tóm tắt: Việc áp dụng trí tuệ nhân tạo (AI) trong lĩnh vực giáo dục đang trở nên
ngày càng phổ biến và thu hút sự quan tâm của các nhà nghiên cứu. Trong số các mô hình
AI, ChatGPT nổi bật với khả năng tạo ra phản hồi giống con người cho các câu hỏi và đề
bài dựa trên dữ liệu văn bản được huấn luyện một cách tự động. Bài viết này sử dụng lý
thuyết về đổi mới đột phá như một cơ sở cho việc nghiên cứu tác động và khả năng đột phá
của ChatGPT trong đánh giá trực tuyến. Đồng thời, nó cũng xem xét các vấn đề đạo đức và
ý nghĩa sư phạm của việc áp dụng ChatGPT, đặc biệt là trong việc đánh giá trực tuyến trong
giáo dục từ xa. Sử dụng AI trong đánh giá trực tuyến không chỉ mang lại cơ hội mà còn đặt
ra những thách thức, đặc biệt là cần tiếp cận cẩn thận để đảm bảo tính toàn vẹn học thuật
và xem xét các vấn đề đạo đức. Bài viết này nhằm góp phần vào cuộc thảo luận về việc áp
dụng AI trong giáo dục đại học và đánh giá trực tuyến, nhấn mạnh vào sự cần thiết của việc
tiếp tục nghiên cứu và đánh giá chính xác tác động của nó trong giáo dục đại học trong
tương lai.
Từ khóa: trí tuệ nhân tạo, đánh giá trực tuyến, ChatGPT, giáo dục từ xa, đổi mới
đột phá.
I. Giới thiệu về ChatGPT
ChatGPT (Generative Pre-trained Transformer) là một mô hình học máy được giới
thiệu bởi OpenAI lần đầu tiên vào năm 2008 [1]. ChatGPT là một chatbot hội thoại mô hình
ngôn ngữ lớn (LLM2) sử dụng trí tuệ nhân tạo (AI3) để duy trì một phong cách hội thoại với
một nhân cách duy trì nhất quán trong suốt cuộc trò chuyện [2]. Sức hấp dẫn của nó là khả
năng tạo ra các phản hồi giống con người logic và ý nghĩa. ChatGPT có thể trả lời các câu
hỏi tiếp theo, thừa nhận sai sót và từ chối các truy vấn không thích hợp. Điều này đóng góp
vào sự tương tác thực tế với người dùng. ChatGPT đã trở thành trợ lí AI được tin cậy tương
tự như Google trong việc cung cấp thông tin [3; 4]. Sự khác biệt giữa ChatGPT và Google
là Google cung cấp thông tin mà người dùng cần phải chọn lọc để đọc và hiểu, trong khi
ChatGPT cung cấp câu trả lời cụ thể theo phong cách hội thoại giống như con người trả lời
một câu hỏi. ChatGPT có thể tạo ra một câu trả lời cho một câu hỏi trong thời gian dưới ba
1 Trường Đại học Bình Dương
2 Large Language Model
3 Artificial Intelligence

202
mươi giây, điều này phụ thuộc vào tốc độ kết nối internet và nó có thể chỉnh sửa, diễn đạt
lại và phân tích một văn bản. Ngoài ra, ChatGPT có thể được sử dụng tạo thư xin việc, tạo
sơ yếu lý lịch (CV), tạo ra những câu chuyện cười, giải thích các vấn đề phức tạp, thảo luận
về các giải pháp toán học theo từng bước, giải thích và viết mã code cũng như tạo nội dung
bằng nhiều ngôn ngữ khác nhau [5; 6]. Nhược điểm của ChatGPT là chất lượng của câu trả
lời do ChatGPT phản hồi (đầu ra) phụ thuộc vào chất lượng của câu hỏi hoặc thông tin yêu
cầu (đầu vào) của người sử dụng. Một số người dùng ChatGPT đã phát hiện ra rằng ChatGPT
có thể cung cấp các phản hồi không chính xác với thông tin không đầy đủ. Hơn nữa,
ChatGPT không bao gồm các sự kiện sau năm 2021 và nếu máy chủ của nó quá tải, thì nền
tảng sẽ không thể truy cập được trong một thời gian nhất định [7].
II. Cơ sở lý luận
Dựa trên lý thuyết về sự đổi mới đột phá của Christensen [8; 9], chúng tôi xác định
các quy trình của việc đánh giá trực tuyến như chúng ta đã biết hiện nay có khả năng thay
đổi đáng kể về hình thức. Nghiên cứu này bổ sung vào cuộc thảo luận hiện tại về ChatGPT
[10; 11; 12] và các mối quan ngại của giảng viên về tính đáng tin cậy của việc đánh giá trực
tuyến. Các nghiên cứu về ChatGPT trong các bối cảnh đào tạo từ xa và đào tạo trực tuyến
đang là xu hướng hiện nay. Vì vậy, mục đích của chúng tôi là tập trung sự quan tâm đến
tương lai của việc đánh giá trực tuyến trong giáo dục đại học ở bối cảnh sử dụng ChatGPT.
ChatGPT là một sự phát triển tất yếu dựa trên những tiến bộ của công nghệ AI trong vòng
một thập kỷ qua [5, 6]. Những nghiên cứu về ChatGPT cho thấy khả năng đột phá của nó có
tác động đến hoạt động đánh giá trực tuyến ở các cơ sở giáo dục đại học. Vì vậy, chúng tôi
đặc ra câu hỏi: Trong tương lai, việc đánh giá trực tuyến ở các cơ sở giáo dục đại học, đặc
biệt là đào tạo từ xa sẽ như thế nào khi ChatGPT tham gia vào quá trình này?
Bài báo này tập trung vào việc sử dụng ChatGPT trong lĩnh vực đào tạo từ xa và đào
tạo trực tuyến. Đầu tiên, đặt ra giả thuyết về ChatGPT như một đổi mới đột phá trong đánh
giá trực tuyến, với khả năng tạo ra câu trả lời tự nhiên và thông minh tương tự như con người.
Sau đó, đánh giá hiệu suất của ChatGPT trong việc thực hiện đánh giá theo cách truyền
thống. Bài báo cũng đề cập về sự đột phát và tiềm năng của ChatGPT trong việc chuyển đổi
từ đánh giá truyền thống sang đánh giá trực tuyến, đặc biệt là trong ngữ cảnh của đào tạo từ
xa và đào tạo trực tuyến. Ngoài ra, cũng nhấn mạnh về ý nghĩa đạo đức của việc sử dụng
ChatGPT trong đánh giá trực tuyến, bao gồm cả việc xử lý các vấn đề liên quan đến gian lận
và đảm bảo tính minh bạch và trách nhiệm trong việc sử dụng công cụ này. Cuối cùng, phân
tích ý nghĩa của việc tích hợp ChatGPT trong đánh giá trực tuyến, với hy vọng sẽ tạo ra cơ
hội mới và đề xuất những giải pháp trước những thách thức về đạo đức và trách nhiệm.
III. Kết quả và thảo luận
3.1. Đưa ra giả thuyết ChatGPT như một sự đổi mới đột phá trong đánh giá trực tuyến
Khái niệm “đổi mới đột phá” đã trở thành một thuật ngữ thịnh hành trong thập kỷ

203
qua, với nhiều nghiên cứu sử dụng nó để xác định và giải thích các hiện tượng có khả năng
biến đổi thế giới một cách tích cực [13]. Giáo sư Clayton Christensen [8] định nghĩa đổi mới
đột phá là “một quá trình mà một sản phẩm hoặc dịch vụ ban đầu bắt đầu từ các ứng dụng
đơn giản ở dưới đáy của thị trường và sau đó không ngừng tiến lên trên thị trường, cuối
cùng làm thay thế các đối thủ cạnh tranh lâu đời”. Chúng tôi biết rằng lý thuyết về đổi mới
đột phá của Christensen thường được sử dụng trong lĩnh vực kinh doanh và công nghệ. Tuy
nhiên, chúng tôi đã sử dụng nó như là một cơ sở để tìm hiểu tiềm năng đột phá và đổi mới
mà ChatGPT có thể mang lại trong việc đánh giá trực tuyến trong giáo dục đại học.
Các đổi mới mang tính đột phá trong đánh giá trực tuyến thường xuất phát từ các
công nghệ mới như trí tuệ nhân tạo và máy học. Mặc dù ở giai đoạn ban đầu chúng có thể
không hiệu quả bằng các công nghệ đã được biết, nhưng chúng lại rẻ hơn và dễ tiếp cận hơn.
Theo thời gian, chúng cải thiện và vượt qua các công nghệ đã có, tạo ra một thị trường mới.
Ví dụ như sử dụng trí AI và học máy để tự động hóa và cá nhân hóa quá trình đánh giá, giúp
giảm chi phí và tăng tính chính xác [13]. Một ví dụ khác là sử dụng trò chơi để tạo ra các bài
kiểm tra hấp dẫn và tương tác, tăng sự hứng thú và động lực của sinh viên. Các phương pháp
này có thể tạo ra trải nghiệm đánh giá sống động và thú vị hơn, góp phần vào kết quả học
tập tốt hơn [14].
Đánh giá trực tuyến trong giáo dục từ xa thường phụ thuộc vào sự can thiệp của giám
khảo là con người, tuy nhiên con người có hạn chế về số lượng, chi phí cao và dễ xảy ra sai
sót. Với sự tiến bộ của công nghệ AI như ChatGPT, các trường đại học có thể cung cấp các
đánh giá hiệu quả hơn và đáng tin cậy với chi phí thấp hơn [15]. ChatGPT đã được áp dụng
để tự động hóa các nhiệm vụ như đánh giá bài luận, trả lời câu hỏi và cung cấp phản hồi cho
sinh viên, giảm bớt gánh nặng công việc của giảng viên và cung cấp phản hồi ngay lập tức
[16]. Sức mạnh đột phá của ChatGPT đến từ khả năng học hỏi và phát triển dựa trên thông
tin người dùng cung cấp, từ đó thay đổi cách sinh viên tương tác với tài liệu học tập của
mình và tạo điều kiện thuận lợi cho việc tiếp cận tri thức [9]. Trong lĩnh vực giáo dục đại
học, các công nghệ mới như ChatGPT đã góp phần hỗ trợ việc vượt qua các thách thức do
đại dịch COVID-19 đặt ra, cung cấp một mô hình giáo dục từ xa linh hoạt, cá nhân hóa và
dễ tiếp cận [8; 15; 13].
Bằng cách áp dụng lý thuyết về đổi mới đột phá của Christensen [8] vào ChatGPT,
chúng ta có thể hiểu rõ hơn về tác động của công nghệ này đối với tương lai của tương tác
giữa con người và máy móc. Đồng thời, chúng ta cũng có thể đánh giá những hệ quả đạo
đức của việc sử dụng ChatGPT trong giáo dục, bao gồm ảnh hưởng đến tính toàn vẹn học
thuật và minh bạch trong quá trình đánh giá. Ngoài ra, áp dụng lý thuyết này cũng giúp chúng
ta hiểu được những thay đổi mà ChatGPT có thể mang lại cho việc đánh giá trực tuyến trong
giáo dục đại học.

204
3.2. Hiệu suất của ChatGPT trong việc đánh giá truyền thống
Trong những năm gần đây, việc sử dụng ChatGPT đã mở rộng đáng kể. Tuy nhiên,
có rất ít bài công trình nghiên cứu để tham khảo trong lĩnh vực giáo dục từ xa. Để hiểu rõ
một cách toàn diện về tiềm năng và cơ hội của ChatGPT trong đánh giá truyền thống, chúng
tôi đã nghiên cứu các tài liệu được bình duyệt có liên quan đến nội dung này.
Trong một nghiên cứu được thực hiện tại Hà Lan, ChatGPT được sử dụng để hoàn
thành một bài kiểm tra về hiểu biết tiếng Anh ở bậc trung học. Bài kiểm tra bao gồm các câu
hỏi trắc nghiệm và các câu hỏi yêu cầu câu trả lời ngắn. Điểm trung bình của học sinh là 7,0
cho bài kiểm tra trong khi ChatGPT đạt được điểm là 7,18. Kết quả này cho thấy rằng
ChatGPT hoạt động tương tự như học sinh trung bình ở Hà Lan. Điều này sẽ gây lo ngại nếu
học sinh ở Hà Lan được phép tham dự kỳ thi của họ trực tuyến [10]. Trong nghiên cứu của
Kung và đồng nghiệp [11], ChatGPT đã được thử nghiệm trong lĩnh vực y tế, cụ thể là trong
việc trả lời kỳ thi cấp giấy phép y tế của Hoa Kỳ. ChatGPT đã được sử dụng để làm ba bài
kiểm tra và kết quả cho thấy rằng ChatGPT vượt qua hoặc gần ngưỡng đậu cho cả ba kỳ thi.
Ngoài ra, ChatGPT đã thể hiện một mức độ phù hợp cao và cái nhìn sâu sắc trong các giải
thích của mình. Kết quả này gợi ý rằng các hệ thống học máy như ChatGPT có tiềm năng để
hỗ trợ giáo dục y học và có thể đưa ra quyết định lâm sàng. Nhóm tác giả của nghiên cứu
này tin rằng ChatGPT có thể có ảnh hưởng đến hoạt động chăm sóc lâm sàng trong tương
lai bằng cách cung cấp dịch vụ chăm sóc sức khỏe cá nhân hóa. Một nghiên cứu khác được
tiến hành bởi Christian Terwiesch [12] tại Đại học Pennsylvania (Hoa Kỳ) về cách ChatGPT
thực hiện bài thi của khóa học MBA. Kết quả cho thấy ChatGPT đạt điểm cao trong việc trả
lời các câu hỏi liên quan đến quản lý hoạt động và phân tích quy trình. Đặc biệt, ChatGPT
đã thể hiện khả năng điều chỉnh phản hồi dựa trên gợi ý từ con người cung cấp. Tuy nhiên,
nghiên cứu cũng xác định hai hạn chế của ChatGPT là nó thường gặp lỗi trong tính toán cơ
bản và gặp khó khăn với các câu hỏi phân tích quy trình phức tạp hơn. Kết quả ChatGPT
nhận được điểm từ B đến B- trong kỳ thi. Nghiên cứu này nhấn mạnh vai trò quan trọng của
hiệu suất của ChatGPT đối với các phương pháp đánh giá và cấp bằng truyền thống. Nếu
những khóa học như vậy được cung cấp trực tuyến, độ tin cậy của kết quả khóa học có thể
bị nghi ngờ.
Trong ba nghiên cứu đã được thảo luận, chúng ta đã thấy khả năng của ChatGPT
trong việc vượt qua bài kiểm tra Tiếng Anh [10], kỳ thi y tế [11] và khóa học MBA [12].
Khả năng này của ChatGPT có tác động đối với các kỳ thi quan trọng khi bài kiểm tra được
tổ chức trực tuyến hoặc theo hình thức thi mang về nhà. Tuy nhiên, trong bối cảnh của
ChatGPT, sự hợp lệ và đáng tin cậy của những kỳ thi này có thể bị nghi vấn. Việc cấm sử
dụng ChatGPT có khả năng sẽ trở nên phổ biến trong tương lai, nhưng cũng có thể gặp phải
sự phản đối trước khi các tổ chức có thời gian thay đổi chính sách. Việc sử dụng ChatGPT
có thể làm thay đổi phương pháp truyền thống của việc đánh giá trực tuyến. Tuy nhiên, các
trường đại học có thể gặp khó khăn trong việc thực hiện lệnh cấm ChatGPT do nhiều thách

205
thức và sự phản đối của các bên liên quan . Tuy vậy, bất kỳ sự đổi mới nào, các bên liên
quan cần thích ứng để duy trì sự phát triển và cạnh tranh trong bối cảnh phát triển mạnh của
trí tuệ nhân tạo trong nhiều lĩnh vực nói chung, trong lĩnh vực giáo dục nói riêng, đặc biệt
khi ChatGPT được xem là một công nghệ đột phá.
3.3. Sự đột phát và tiềm năng của ChatGPT trong việc chuyển đổi đánh giá trực tuyến
Đánh giá là một thành phần quan trọng trong giáo dục và được sử dụng để thu thập,
phân tích và diễn giải quá trình học tập của sinh viên. Phản hồi này rất quan trọng đối với
sinh viên vì nó giúp họ hiểu rõ về điểm mạnh và điểm yếu của mình trong quá trình học tập.
Hơn nữa, phản hồi này cũng có ích cho giảng viên vì nó có thể giúp họ điều chỉnh phương
pháp giảng dạy và truyền đạt.
Đánh giá trực tuyến là việc sử dụng công nghệ để đánh giá kỹ năng, kiến thức và khả
năng của sinh viên thông qua các nền tảng kỹ thuật số như ứng dụng dựa trên web, thiết bị
di động hoặc các bài kiểm tra dựa trên máy tính [17]. Có nhiều công cụ đánh giá khác nhau
được sử dụng, bao gồm câu hỏi nhiều lựa chọn, trả lời ngắn, bài luận, tự đánh giá và đánh
giá ngang hàng. Cách triển khai đánh giá trực tuyến thay đổi tùy theo mục tiêu học tập và
công nghệ có sẵn. Đánh giá trực tuyến có thể được thực hiện thông qua hệ thống quản lý học
tập LMS như Moodle, với các thông số như giới hạn thời gian, ngẫu nhiên và số lần sinh
viên có thể thực hiện bài kiểm tra được tùy chỉnh. Có hai loại đánh giá phổ biến là đánh giá
quá trình và đánh giá tổng kết. Đánh giá quá trình được sử dụng để đưa ra nhận xét phản hồi
về việc học của sinh viên trong suốt thời gian học tập tại trường. Đánh giá tổng kết được sử
dụng để đánh giá kết quả học tập vào cuối khóa học [17].
Nghiên cứu của Al-Maqbali & Hussain [17] đã chỉ ra nhiều lợi ích của việc đánh giá
trực tuyến. Sự tiện lợi và linh hoạt cho phép cá nhân thực hiện các bài đánh giá theo ý muốn
của họ, giảm bớt các ràng buộc về thời gian biểu và tăng tính khả dụng. Khả năng mở rộng
của đánh giá trực tuyến cho phép đáp ứng nhiều sinh viên cùng một lúc và cung cấp phản
hồi ngay lập tức, giúp sinh viên cải thiện kết quả học tập. Tuy nhiên, việc ngăn chặn và phát
hiện gian lận trong môi trường trực tuyến có thể gặp khó khăn, đồng thời sinh viên thường
cảm thấy căng thẳng hơn khi tham gia đánh giá trực tuyến so với các hình thức đánh giá
truyền thống.
Việc thực hiện đánh giá trực tuyến trong giáo dục đã tăng đáng kể, đặc biệt là do đại
dịch COVID-19 buộc các cơ sở giáo dục phải chuyển sang hình thức học và đánh giá trực
tuyến. Mặc dù đã có nhiều triển khai đánh giá trực tuyến ở các quốc gia khác nhau, nhưng
vẫn chưa có sự đồng thuận rõ ràng về việc liệu đánh giá trực tuyến có được ưa chuộng hơn
so với đánh giá trực tiếp hay không. Rào cản lớn nhất là vấn đề về máy tính và kết nối internet
[18]. Trong việc thực hiện các bài kiểm tra trực tuyến, quan trọng là giảng viên cần đảm bảo
rằng các câu hỏi được sắp xếp rõ ràng và không gây hiểu nhầm, đồng thời cung cấp hướng
dẫn cụ thể cho sinh viên về cách tiếp cận và hoàn thành bài kiểm tra. Ngoài ra, giảngviên

