204 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
NHN DIỆN ĐẶC ĐIỂM NGÔN NG TRONG VĂN BẢN
ĐƯC VIT BI TRÍ TU NHÂN TO (AI) VỚI VĂN BẢN
ĐƯC VIT BỞI CON NGƯỜI VÀ ĐÁNH GIÁ HIỆU SUT
CA CÔNG C PHÁT HIỆN VĂN BẢN DO AI VIT
TRNH KHÁNH HIN*
Tóm tt. Trong bi cnh trí tu nhân to (AI) phát trin nhanh chóng hc sinh, sinh
viên có xu hướng lm dng các công c chatbot như ChatGPT để to lập văn bản, vấn đề phân
biệt văn bản do con người viết và văn bản do AI viết càng tr nên cp thiết. Nghiên cứu được
thc hin bng phương pháp thu thập d liu vi ba nhóm ng liệu như sau: (1) 30 văn bản do
người viết, (2) 90 văn bản do AI viết, (3) 30 văn bản do AI viết trong ln to sinh th hai đã
được chnh sa bởi con người; sau đó, chúng tôi s dng phn mềm R để x s liu và to
ra các biểu đồ, hình nh mang tính trc quan. Kết qu nghiên cu cho thy mt s đặc điểm
ngôn ng không gtr phân biệt văn bản do người viết AI, đồng thi ch ra các đặc điểm
ngôn ng nhn din hai loại văn bản này bao gm: t ch ngôi, t ch yếu t bản địa, câu đơn,
câu phc, câu ghép câu tỉnh lược, câu hi tu t, hình thức đoạn văn, phương tiện liên kết
câu, li chính t li ng pháp. Trong gii hn nghiên cu, chúng tôi nhn thy GPTZero
đạt hiu sut cao nht và là công c h tr đáng tin cậy trong vic phát hiện văn bản AI.
T khóa: AI, ChatGPT, tạo sinh văn bản, văn bản tiếng Vit
1. M đầu
ChatGPT được s dng ngày càng rng rãi và h tr người dùng trong vic to lập văn
bn vi các ch đề đa dng, phong phú. Haleem và cng s (2022) đã đánh giá cao kh năng
của ChatGPT: “Nó có thể to ra các bài lun, câu chuyện hư cấu, thơ haiku và thậm chí c thư
xin việc cho đơn xin vic. ChatGPT th cung cp gii pháp cho nhng vấn đề quan trng
ln nhng vấn đề nh nht nht trong cuc sống” [11, tr.7]. Črček Patekar (2023) [8] đã
kho sát mức độ ph biến ca vic s dụng ChatGPT đ làm bài tp viết đối với sinh viên đại
hc Croatia. Hơn một na s sinh viên s dng công c này để làm bài tp viết vi mục đích
ch yếu tìm ý tưởng, trong khi nhiu sinh viên s dụng để tóm tt, din gii hoc viết
mt phn bài tp; t đó, tác giả cũng đặt ra vấn đề đạo đức khi s dng ChatGPT trong hc
tp. Trong bi cnh hc sinh, sinh viên lm dng và ph thuc vào ChatGPT, vn đề phân bit
và nhn diện đặc điểm văn bản do con người viết và văn bản do trí tu nhân to (AI) viết càng
tr nên cp thiết.
* SV, Trường Đại học Sư phạm Hà Ni; Email: khanhhien816@gmail.com
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 205
...................................................................................................................................................................................
Trước tình hình đó, các công cụ nhn diện văn bản AI đã được phát trin s dng
trong thc tin. Tuy vy, các công c phát hiện văn bản do AI viết không đưa ra kết qu chính
xác tuyệt đối. Ladha cng s (2023) [14] đã thử nghim quét 4 bài báo nghiên cu trên
công c phát hin AI và kết qu cho thy công c này không th xác định chính xác tt c ni
dung AI viết, thm chí th b thao túng để đưa ra kết qu sai. Các công c phát hin ni
dung AI ph biến trên thế gii chưa được điều chỉnh để phù hp với văn bn tiếng Vit, do
đó, cần có nhng nghiên cu và th nghiệm kĩ lưỡng hơn để đánh giá các công cụ này.
Trong bài viết y, chúng tôi kho sát, thống đặc đim ngôn ng của văn bản do
con người viết và văn bn do AI viết, đồng thời đánh giá hiệu sut các công c phát hiện văn
bn AI, t đó góp phần d đoán và lí giải các quyết định phân loi ca các công c trên.
2. Tng quan nghiên cu
2.1. ChatGPT và mt s công c nhn diện văn bản AI
Theo Kirmani, ChatGPT mt công c công cng do OpenAI phát trin da trên công
ngh mô hình ngôn ng GPT [13]. OpenAI đã phát trin và phát hành mt s mô hình AI ni
bt, bao gm dòng GPT (Generative Pre-training Transformer) các hình ngôn ng ln
có kh năng hiểu và to ra văn bản giống con người. ChatGPT to ra phn hi da trên thông
tin đầu vào nhận được, t đó cung cấp các câu tr li phù hp mch lc cho các câu hi/
câu lnh của người dùng. S phát trin ca ChatGPT gn vi nhng ci tiến liên tc trong
chui mô hình GPT, thúc đẩy s thích ng vi nhu cầu ngày càng đa dạng của người dùng.
Để đối phó vi s gia tăng của các công c tạo văn bản AI như ChatGPT, một s công
c phát hiện văn bản AI đã được phát trin nhm phân biệt văn bản do con người và AI to ra.
Mt trong nhng công c đầu tiên Scribbr [20], ra mắt vào năm 2012 đã m rng kh
năng của mình t kiểm tra đạo văn sang nhận diện văn bản AI vào năm 2020. GPTZero [10]
được thiết kế để xác định văn bản do AI to ra nhiu cấp độ khác nhau, t cm t đến toàn
b tài liệu. hình GPTZero được đào tạo trên nhiu loại văn bản do con người viết do
AI to ra, tập trung vào văn bn tiếng Anh. Công c phát hin ni dung AI ca Quillbot [17]
được đào to vi các thuật toán nâng cao đ xác đnh các t lp li, cm t khó hiu và thiếu
mch lc. Hin ti, Quillbot ch th nhn din nội dung dưới dạng văn bản, chưa thể thc
hin vi ni dung hình nh, video. Plagiarism Detector [16] s dng trình kim tra ChatGPT
đào sâu và trích xuất các tính năng của ni dung, bao gm cu trúc câu, t vng và b cc để
xác đnh t l nội dung AI trong văn bản. ZeroGPT [23], vi s h tr ca các thut toán hc
máy k thut x ngôn ng t nhiên, d đoán nguồn gốc văn bản hoc cm t với độ chính
xác cao da trên d liu ln. Các công c trên đóng vai trò quan trọng trong vic nhn din và
phân biệt văn bản do AI viết. Tuy vy, chính nhng nhà phát trin công c cũng thừa nhn hn
chế ca khuyến ngh cn kết hp với đánh giá của con người để đưa ra kết qu chính
xác nht.
206 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
2.2. Nhng nghiên cu v vic nhn diện văn bản do AI và con người viết và công
c phát hiện văn bản do AI viết
Các xu hướng nghiên cu hin nay v s phân biệt văn bản do AI con người viết
cho thy s quan tâm ngày càng tăng về các du hiu nhn din kh năng phân biệt gia
hai loại văn bản này trong các ng cảnh, đối tượng khác nhau. Mt s nghiên cứu đã tập trung
vào kh năng phân biệt giữa văn bản do con người viết văn bản do AI to ra, vi kết qu
ch ra rng c người dùng thông thường lẫn chuyên gia đều gp khó khăn trong vic nhn din.
Waltzer cng s (2023) [21] phát trin Bài kim tra nhn dng AI ghi nhn rng giáo
viên và hc sinh ch đạt độ chính xác lần lượt là 70% và 62% khi phân bit gia các bài lun
do hc sinh ChatGPT viết, cho thy tính phc tp ca vic nhn din. Giáo viên xu
hướng nhn diện văn bản của AI thông qua đặc điểm ngôn ng như các từ liên kết và cho rng
khó phân bit các bài luận được viết tt ca hc sinh với các văn bản ChatGPT. Tương tự,
nghiên cu ca Ramu và cng s (2023) [18] cho thy thế h Z gặp khó khăn trong việc phân
bit nội dung do AI và con người viết trên nn tng Discord, đặc bit là những người có mc
độ quen thuc thấp hơn vi Discord và AI li kh năng nhận din tốt hơn so vi nhng
người có kinh nghim.
Khi so sánh chất lượng văn bản do AI to ra với văn bản do con người viết, các nhà
nghiên cu ch ra rằng văn bn của AI thường có cấu trúc ràng hơn nhưng thiếu s tinh tế
v ng pháp và nội dung. Özçelik (2023) [15] đã so sánh kh ng hiệu đính và chỉnh sa ca
ChatGPT với con người. Kết qu cho thy ChatGPT hu ích trong vic sa li chính t, quy
tc chm câu và viết hoa nhưng không thể thay thế con người trong vic hiệu đính văn bản v
nội dung độ chính xác ng pháp. Herbold và cng s (2023) [12] đã so sánh đặc điểm ngôn
ng gia các bài luận do con người viết do ChatGPT to ra. Tác gi cũng phát hiện rng
các bài lun do ChatGPT to ra cu trúc cht ch nhưng li tuân th mt cách cng nhc,
còn bài viết ca con người có tính linh hot và sáng tạo hơn. Nghiên cứu ca Sandler và cng
s (2024) [19] m rng phân tích này bng cách so sánh các cuộc đối thoi gia con người và
ChatGPT, nhn mnh cuộc đối thoi giữa con người vi nhau tính xác thực đa dạng hơn,
nhưng ChatGPT lại có ưu thế x lí xã hi, phong cách phân tích, nhn thc, s tp trung chú
ý và cm xúc tích cc.
Nhiu nhà nghiên cứu đã quan tâm đến việc đánh giá hiệu sut các công c có sn hin
nay hướng đến xây dng nhng công c mi, vi tính năng hoàn thiện kh năng nhận
din ngôn ng đa dạng, phong phú hơn. Elkhatat và cộng s (2023) [9] đánh giá hiệu sut ca
5 công c phát hiện văn bản AI, các công c này đều xác định tt ni dung do GPT 3.5 to ra
nhưng lại gặp khó khăn với ni dung do GPT 4 to ra, chng minh hiu sut ca các công c
th thay đổi đáng kể tùy thuộc vào độ phc tp ca hình AI. Alshammari cng s
(2024) [5] đã giới thiu mt công c phát hiện văn bn AI mi dành cho tiếng Rập, đạt độ
chính xác 81%, cao hơn đáng k so vi GPTZero và OpenAI Text Classifier. Weber-Wulff và
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 207
...................................................................................................................................................................................
cng s (2023) [22] khẳng định rng hu hết các công c phát hiện văn bản AI hiện nay đu
không chính xác, với độ chính xác dưới 80%. c công c y thường gán nhm tài liu do
con người viết là do AI tạo ra và ngược lại. Chaka (2023) [6] đã kiểm tra tính chính xác ca 5
công c phát hiện văn bản AI để phát hin ni dung do AI to ra trong các phn hồi được to
bi ChatGPT, YouChat Chatsonic. Tác gi kết lun rng các công c phát hin hin ti
chưa đủ kh năng phát hin chính xác và thuyết phục văn bản do AI tạo ra, đặc bit là khi văn
bản này được dch sang các ngôn ng khác nhau.
Vit Nam, vấn đề ng dng trí tu nhân to ChatGPT trong giáo dc thu hút s
quan tâm ca nhiu nhà nghiên cu. Nhng nghiên cứu đánh giá khả năng, vai trò ca
ChatGPT trong vic h tr ging dy, hc tp các môn hc c th của Trương Hana (2023)
[3], Lê Anh Vinh (2023) [4], Thái Th Cẩm Trang (2023) [2] … đều đánh giá cao khả năng tư
duy ca ChatGPT nhưng cũng ch nhng hn chế, nhược điểm ca công c y. Tuy vy,
còn thiếu nhng nghiên cu v mi quan h gia trí tu nhân tạo lĩnh vực ngôn ng, s
thích nghi ca trí tu nhân to vi ngôn ng tiếng Việt. Do đó, nghiên cu v đặc điểm ngôn
ng giữa văn bản do con người viết văn bn do AI viết cũng như đánh giá hiệu sut các
công c phát hiện văn bản AI vn là mt khong trng cn lấp đầy.
3. Phương pháp nghiên cứu
Chúng tôi thu thp và phân loi ng liu theo ba nhóm, bao gồm: (1) Văn bản do con
người viết, (2) Văn bản do ChatGPT viết, (3) Văn bản do ChatGPT viết đã được người chnh
sửa. Chúng tôi đưa ra ba câu hỏi đối với con người và ChatGPT, các câu hi lần lượt là:
(1) Viết đoạn văn (8 câu) giới thiu v mt sn phm thuộc văn a đi chúng ngày
nay. (2) Viết đoạn văn (8 câu) chỉ ra biu hin cho thy s ảnh hưởng ca suy thoái kinh tế
đến hành vi tiêu dùng.
(3) Viết đoạn văn (8 câu) trình bày suy nghĩ của bn thân v mt vn đề cn khc phc
trong giáo dc hin nay.
Nhóm ng liệu 1 được thu thp bng phương pháp phỏng vn kho sát thông qua
bng câu hỏi. 30 người thc hin kho sát thuộc các độ tuổi khác nhau: dưới 18 tui, t 18 đến
30 tui và trên 30 tui. Những người tham gia thc hin viết các đoạn văn ngắn, mỗi đoạn có
thi gian chun b và viết trong 10 phút. Nhóm ng liệu này được gán mã t A1 đến C30.
Nhóm ng liệu 2 được thu thp bằng cách đưa ra lần lượt các câu hi trên cho ChatGPT.
Tuy nhiên, khác vi câu hỏi đặt ra câu hỏi cho người, chúng tôi đặt câu lnh cho ChatGPT
mi phn hi cn viết 10 đoạn văn. Đối vi mi ch đề, chúng tôi s to ln th nhất 10 văn
bản, sau đó nhấn nút to li (regenerate) 2 lần để tiếp tc thu thập 20 văn bản. Chúng tôi d
kiến những văn bản sau khi được ChatGPT to li s có s ci thin v ý tưởng và cách din
đạt. Nhóm ng liệu này được gán mã t Aa1 đến Cc30.
208 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
Nhóm ng liu th 3 được ly t 30 văn bản được to li ln th 2 (10 văn bản/1 ch
đề). Chúng tôi thc hin chnh sửa các văn bản này vi 5 du hiu: thêm t nối, thêm từ,
ghép câu, thêm li chính t và thêm li ng pháp. Mục đích của vic chnh sửa văn bản là to
ra văn bản mới đặc đim gn với văn bản con người hơn và đánh giá khả năng nhận din
ca các công c phát hin ni dung AI. Nhóm ng liệu này được gán mã t Aa1s đến Cc30s.
Sau khi thu thp ng liu, chúng tôi s dng phn mềm R để xs liu và to ra các
biểu đồ, hình nh mang tính trc quan, cho thấy các xu hướng s dng ngôn ng của con người
và AI. Chúng tôi tiến hành gán nhãn d liu và x sơ bộ d liu bng cách phân chia ngun
và ch đề, làm sch d liu tha hoc lp li. Cui cùng, chúng tôi trc quan hóa d liu bng
các package (gói) có sn.
4. Kết qu nghiên cu
4.1. Nhn diện đặc điểm ngôn ng của văn bản do con người viết văn bn do
AI viết Trong gii hn ca nghiên cu, chúng tôi ch kho sát mt s đặc điểm ngôn ng ca
văn bản do con người viết và văn bn do trí tu nhân to viết, bao gồm: đặc điểm âm tiết, đặc
điểm từ, đặc đim câu và t chức văn bản. Chúng tôi din gii, phân tích kết qu thu được
kết lun kết qu âm tính (nhng yếu t không có giá tr phân biệt văn bản do người viết và văn
bn do AI viết), kết qu dương tính (những yếu t nhn din s khác bit gia hai loại văn
bn).
i) Đặc điểm âm tiết
Chúng tôi nhn thy s khác bit ràng giữa n bn do AI viết văn bản do
người viết v s ng âm tiết, trong đó số ng âm tiết trung bình trong văn bản do người
viết thường cao hơn (Hình 1). Đối vi ch đề giáo dc, s ng âm tiết trong văn bản do con
người viết có giá tr trung bình cao nht (mean = 221,2) còn s ng âm tiết trong văn bản do
AI viết có giá tr trung bình thp nhất (mean = 178,4). Con người có xu hướng tạo ra văn bản
s ng âm tiết nhiều hơn so với văn bản ca AI. Kết qu kho sát cho thy s âm tiết
trong văn bản ca con người độ lch chun khá ln (77,7 - 88,7). Văn bản do người viết
linh hoạt, đa dạng v s ng âm tiết; mỗi người vi vn kiến thc, tri nghim khác nhau s
to ra những văn bản đ dài khác nhau. Ngược li, s ng âm tiết trong văn bản do AI
viết có độ lch chun thấp, dao động t 21 đến 28,1. AI được đào tạo da trên kho d liu có
sn, do vy, AI có th x lí các ch đề khác nhau nhưng không có sự phân hóa rõ rt.
Văn bản do con người tạo ra xu hướng phc tạp hơn văn bn do AI to ra vi s
ng âm tiết trên câu cao hơn (Hình 2). Biểu đồ th hin giá tr s âm tiết trên câu nhóm
văn bản con người biến động khá lớn, đặc bit ch đề xã hội (sd = 12,2). Điu y cho
thấy con người s dng các loi câu với độ dài phong phú, không cng nhc và ph thuc vào
yếu t nhân. Ngược lại, văn bản do AI viết đ lch chun thp (2,4 - 3,2), cho thy s
ng âm tiết trên câu trong nhóm văn bản này tương đối đồng đều. Vic các câu do AI to ra