336 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
NG DNG CÔNG C CLC _VN_ TOOLKIT
ĐỂ XÁC ĐỊNH ĐỘ KHÓ CA N BẢN VĂN XUÔI
TRONG CHƯƠNG TRÌNH NGỮ N LỚP 6
VÀ ĐỊNH HƯỚNG VN DNG KT QU TRONG DY HC
CHÂU TH ĐỖ QUYÊN* - NGUYN TH THU HNG**
Tóm tt: Bài viết tóm tt kết qu nghiên cu ca chúng tôi v vic vn dng lí thuyết
đo độ khó văn bản (ĐKVB), với s h tr ca công c CLC _VN_ Toolkit, vào vic phân tích,
đánh giá ngữ liệu văn bản văn xuôi trong chương trình sách giáo khoa Ngữ văn lớp 6. T
kết qu khảo sát ĐKVB, dựa trên thang đo nhận thức Bloom, chúng tôi đã vn dụng để xây
dựng các định hướng trong phương pháp m rng và tích cc hóa vn t cho hc sinh.
T khóa: Công c CLC _VN_ TOOLKIT, độ khó văn bản, Ng văn lớp 6, b sách
Chân tri sáng tạo, thang đo nhận thc Bloom.
I. M đầu
Trong những năm gần đây, độ khó văn bản (ĐKVB) đã được gii nghiên cu quan
tâm và chú ý ti Vit Nam. Tuy nhiên vic nghiên cu ĐKVB trong chương trình (CT) sách
giáo khoa (SGK) ph thông nói chung và SGK trung học cơ sở (THCS) nói riêng vn còn là
mt vấn đề b ng chưa nhận được nhiu s quan tâm ca nhiu nhà nghiên cu. Chúng tôi
thiết ng, trong bi cảnh đổi mi toàn din nn giáo dục nước nhà như hiện nay, nghiên cu
v ĐKVB trong CT SGK s thc s cn thiết để nâng cao năng lực tiếp nhn kh năng
đọc hiu ca HS. T thc tin ging dy tại môi trường THCS chúng tôi nhn thy vic xác
định ĐKVB trên phạm vi t s h tr rt nhiu trong vic ging dy t đó góp phần nâng cao
chất lượng dy hc.
Chúng tôi la chọn phân ch ĐKVB từ góc độ t ca tác phẩm văn xuôi trong CT
Ng văn lớp 6 (b sách Chân tri sáng to) bởi văn bản văn xuôi chiếm s ng ln trong
CT. Đồng thi vic kho sát vn t nhìn t góc độ ĐKVB giúp GV có cái nhìn tng quát v
CT giáo dc mi mà h đang là người trc tiếp triển khai đến HS. Để có th thc hiện được
vic khảo sát và đánh giá ĐKVB trên phạm vi t, công c CLC _VN_ Toolkit là công c
th đảm nhim tt nht vai trò ca mình khi kh năng trích xuất h thng t trên các
mục tiêu đã được đề ra. Căn cứ vào kết qu kho sát, bài viết tiến hành đề xut các gii pháp
dy hc phù hp da trên thuyết là các cấp độ ca thang nhn thc Bloom vi hi vọng đáp
ứng được các yêu cu giáo dục đã đề ra chương trình Ngữ văn lớp 6 nói riêng và chương
trình THCS nói chung.
* Trường THCS Lê Anh Xuân (Qun Tân Phú), Email: doquyenchau@gmail.com
** Trường Đại hc Sài Gòn, Email: ntthang@sgu.edu.vn
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 337
...................................................................................................................................................................................
II. Ni dung
Để có th thc hiện được đề tài nghiên cu, bài viết đã sử dng công c CLC _VN_
Toolkit” do trung tâm ngôn ng hc Tính toán phát trin (CLC - Đại hc Khoa hc T nhiên,
Đại hc Quc gia Thành ph H Chí Minh (http://www.clc.hcmus.edu.vn)). Đây là bộ công
c h tr tin x văn bản, tách t, gán nhãn t loi, gán nhãn các thc th tên trong văn
bn. Công c y có ý nghĩa quan trọng trong vic khảo sát định hướng đánh giá sự nh
hưởng ca yếu t ngôn ng đặc bit là yếu t v b sâu ca t đối với ĐKVB.
2.1. Độ khó ca t
Trong chương trình Ngữ văn lớp 6 40 văn bản văn xuôi. Để xác định độ khó
của văn bản trên phương din t chúng tôi tp trung vào các yếu t b sâu, nhng yếu t
ảnh hưởng trc tiếp đến độ khó của văn bản. Yếu t b sâu của văn bản bao gm: t d và t
khó; tn sut t; t loại; nghĩa của t.
2.1.1. T d và t khó
Việc xác định độ d và khó ca t ý nghĩa quan trọng, góp phần giúp văn bản d
được hc sinh tiếp cn hoặc ngược lại. Để xác định mt t là d hay khó bài viết căn cứ vào
danh sách 3.000 t, ch ph biến t kết qu nghiên cu ca nhóm tác gi Đinh Điền và cng
s (Đinh, Building a cospus-based frequency dictionary of Vietnamese, 2018). Điều này có
nghĩa chúng tôi s thc hin song song hai nhim v tách t, ch t văn bản tiến
hành so sánh, đối chiếu vi h thng t trong danh sách 3.000 ca nhóm tác gi Đinh Điền.
Nếu các ch, t xut hin trong danh sách vừa nêu được xem t d ngược li nếu không
được xut hiện thì đó là chữ, t khó. Văn bản xut hin càng nhiu t d, có ý nghĩa rõ ràng
thì văn bản đó được xem là văn bản d và ngược li. Ngoài ra mức độ khó hay d ca ch
t còn ph thuộc vào độ ph biến, cu trúc tn sut ca chúng. Kết qu kho sát trong
chương trình Ngữ văn 6 như sau:
Bng 2.1. Ch và t dtrong văn bản chương trnh Ngữ văn 6
STT
Tên văn bản
S
ch
Ch d
S t
T d
S
ng
T l %
S
ng
1
Thánh Gióng
562
293
52,14%
482
248
2
S tích H Gươm
807
467
57,87%
669
372
3
Hi thổi cơm thi ở Đồng Vân
524
317
60,50%
433
227
4
Bánh Chưng bánh Giày
538
309
57,43%
444
241
5
S Da
1.115
663
59,46%
974
601
6
Em bé thông minh
1.161
728
62,70%
991
594
338 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
7
Non-bu và Heng-bu
1.046
608
58,13%
884
496
8
K li truyn c tích cây khế
683
407
59,59%
576
333
9
V bài ca dao "Đứng bên ni
đồng ngó bên tê đồng…"
792
495
62,50%
627
343
10
Viết lại đoạn văn ghi li cm
xúc v một bài thơ lục bát
204
128
62,75%
155
84
11
Bài học đường đời đầu tiên
1.892
1.086
57,40%
1.645
935
12
Giọt sương đêm
836
410
49,04%
712
356
13
Va nhm mt va m ca s
1.071
776
72,46%
974
649
14
Cô Gió mt tên
1.769
1.156
65,35%
1.594
1.045
15
K li mt tri nghim ca bn
thân
550
363
66,00%
471
299
16
Lao xao ngày hè
1.153
579
50,22%
991
478
17
Thương nhớ by ong
479
303
63,26%
410
253
18
Một năm ở tiu hc
690
450
65,22%
595
352
19
T mt phiên ch ni min
Tây
525
305
58,10%
445
251
20
Gió lạnh đầu mùa
1.274
779
61,15%
1.124
724
21
Tuổi thơ tôi
1.198
674
56,26%
1.031
554
22
Con gái ca m
904
604
66,81%
745
449
23
Chiếc lá cui cùng
946
577
60,99%
826
500
24
Ch s gi em bng tên
826
626
75,79%
693
487
25
Viết đoạn văn ghi li cm xúc
b bài thơ "Những cánh bum"
223
152
68,16%
173
99
26
Hc thy, hc bn
622
448
72,03%
484
284
27
Bàn v nhân vt Thánh Gióng
526
334
63,50%
389
187
28
Góc nhìn
286
215
75,17%
218
128
NGÔN NG HC TÍNH TOÁN: NHỮNG XU HƯỚNG MI, TRIN VNG VÀ THÁCH THC | 339
...................................................................................................................................................................................
29
Phải chăng chỉ ngt ngào
mi làm nên hnh phúc
991
666
67,20%
774
478
30
Hãy gìn gi bữa cơm gia đình
397
278
70,03%
298
149
31
Lng qu thông
1.379
858
62,22%
1.153
663
32
Con mun làm mt cái cây
1.140
760
66,67%
977
624
33
Và tôi nh khói
917
454
49,51%
828
430
34
Cô bé bán diêm
1.382
832
60,20%
1.194
725
35
K tri nghim v mt chuyến
đi
435
264
60,69%
341
184
36
L cúng thn lúa của người
Chơ-ro
636
364
57,23%
484
214
37
Trái đất - m muôn loài
549
373
67,94%
410
213
38
Hai cây phong
772
476
61,66%
632
349
39
Ngày môi trường thế gii
707
481
68,03%
515
238
40
Viết văn bản thuyết minh li
mt s kin
571
339
59,37%
439
197
Văn bản s ng ln ch t d văn bản “gió mất tên” vi s t d 1.054
t chiếm t l 65,56% s ng t có trong văn bản; tiếp theo là “Bài học đường đời đầu tiên”
935 t d chiếm t l 56,84%. Hai văn bản trên đều thuc th loại truyện đồng thoại”. theo
nhóm tác gi Nguyn Th Hng Nam (Nguyn N. T., et al., 2021) đã nhận định v th loi này
như sau Truyện đồng thoi th loại văn học dành cho thiếu nhi. Nhân vt trong truyn
đồng thoại thưng loài vt hoặc đồ vật đưc nhân hóa. thế, chúng va phản nh đặc
điểm sinh hot ca loài vt va th hiện đặc điểm của con người”. Vi những đặc điểm nêu
trên đã ảnh hưởng đến s ng t d có trong văn bản. Văn bản có s ng ch d và t d
thp nhất Viết đoạn văn ghi li cm xúc v một bài thơ lục bt” vi s ng lần lượt
128 ch d và 84 t d, tuy nhiên khi xét v t l chúng vn chiếm hơn 50% tỉ l ch và t
trong văn bản. Nhng vn bn t ch d chiếm t l thp s gây gây khó đến kh năng
tiếp nhn ca hc sinh.
Kết qu t bng thng kê s liu trên, chúng tôi nhn thy rng s ng ch d trong
văn bản dao động t 128 ch đến 1.128 ch và có t l t d chiếm hơn 50% trong tổng s ch
của văn bản. Xét trên góc độ t 84 t d đến 1045 t d, t l t d chiếm t l t 44,21% đến
70,27% s t d có trong văn bản.
340 | K YU HI THO KHOA HC QUC GIA 2024
...................................................................................................................................................................................
Biểu đồ 2.1. T l trung bình ch d và ch
khó trong văn bản ca SGK Ng văn 6
Thông qua hai biểu đồ trên chúng ta thấy được rng sống lượng ch d và t d chiếm
t l cao hơn tỉ l ch khó t khó, t đó s giúp hc sinh d dàng trong vic tiếp nhn các
văn bản văn xuôi trong chương trình. Bên cạnh đó số ng ch t d cao hoàn toàn phù
hp vi vic rèn luyện kĩ năng đọc - hiu hc sinh khi lp 6.
2.1.2. Tn sut t
Yếu t tn sut t (word frequency) là mt trong nhng yếu t quan trọng khi đánh giá
độ khó của văn bản. Tn sut t (chữ) thường được s dụng đ đánh giá mức độ ph biến và
quen thuc ca các t (ch) trong một văn bản c th. Nó phn ánh mức độ quen thuc và ph
biến ca các t (ch) trong ngôn ng ng cnh c th của văn bản đó. Đây là một s cách
mà tn sut t có th ảnh hưởng đến độ khó của văn bản:
(i) T ph biến vi t ít gặp: Văn bản cha nhiu t ph biến, thường gp s d hiu
hơn so với văn bản cha nhiu t ít gp hoc t chuyên ngành. Các t (ch) ph biến thường
được hc sm và s dụng thường xuyên, nên người đọc d dàng nhn biết và hiu chúng hơn.
(ii) Đa dạng t vựng: Văn bản nhiu t (ch) ít lp li (tc nhiu t khác nhau)
có th khó hiểu hơn vì người đọc phi x lý và hc nhiu t mi trong cùng một văn bản.
(iii) Tn sut t trong ng cnh: T (ch) có tn sut cao trong ng cnh c th s d
hiểu hơn. dụ, trong một văn bản v công ngh thông tin, t y tính s tn sut cao
và do đó dễ hiểu hơn so với t dip lc.
(iv) Trong các công thức tính độ khó của văn bản, t (ch) tn sut thấp thường làm
tăng độ khó của văn bn, trong khi t (ch) tn suất cao thường làm giảm độ khó. Điều này là
do người đọc thường d dàng hơn khi gặp các t mà h đã biết và quen thuc.
62.27%
37.73%
Trung bình tỉ lệ chữ dễ Trung bình tỉ lệ chữ khó
56.51%
43.49%
Trung bình tỉ lệ từ dễ Trung bình tỉ lệ từ khó
Biểu đồ 2.2. T l trung bình t d t
khó trong văn bản ca SGK Ng văn 6