VJE
Tp chí Giáo dc (2024), 24(19), 18-24
ISSN: 2354-0753
18
KHNG SUY LUẬN THỐNG KÊ CỦA HỌC SINH
TRUNG HỌC PHỔ TNG: PHÂNCH BẰNG NH RASCH
Phạm Thế Quân
1,+
,
Trần Trung
2
1
Trường Đại học phạm Nội 2;
2
Học viện Dân tộc
+ c giả liên hệEmail: phamthequan@hpu2.edu.vn
Article history
Received: 10/6/2024
Accepted: 31/7/2024
Published: 05/10/2024
Keywords
Statistical reasoning ability,
students, high school,
analysis, Rasch model
ABSTRACT
Among many models of the Item Response Theory (IRT), the Rasch model
is the simplest and most commonly used. Mathematician George Rasch has
built a simple question characteristic function model that is widely used today.
In this paper, we apply the Rasch model of the Item Response Theory (IRT)
to analyze test questions and statistical reasoning ability of high school
students. The results of the experimental study were analyzed with
quantitative methods, the data were processed with QUEST and SPSS 20.0
software. The research subjects were 108 grade 10 students of Binh Giang
High School, Binh Giang District, Hai Duong Province. The research results
showed that the test questions had high reliability, the distribution of difficulty
of the questions in the test covered the students' abilities. In terms of statistical
reasoning, the surveyed students performed relatively well in basic skills such
as calculating, reading and understanding charts presenting data. However,
there were still limitations in applying statistical knowledge to analyze,
explain and draw meaningful conclusions from given data. Another notable
point is that there was no significant difference in statistical reasoning ability
between male and female students.
1. Mở đầu
Ngày nay, Thng Xác suất (TK&XS) đóng vai trò quan trọng trong mi lĩnh vực, t khoa hc t nhiên,
thut, kinh tế cho đến khoa hc xã hi. TK&XS công c gp con người thu thp, phân ch và gii thích d liu
mt cách hiu qu. Khi TK&XS mi được đưa o Chương trình giáo dục ph thông 2018, quá trình dy hc ch
yếu tp trung o thc hin c pp tính để m ra các con s thng . Tuy nhiên, nh s phát trin ca công ngh,
vic thc hin c phép nh phc tp kng n mc tiêu chính. Thay o đó, trọng tâm đã dịch chuyn sang vic
phát trin tư duy, rèn luyện kh ng suy luận theo hưng thng kê. Vit Nam, có th k đến mt s nghiên cu
theo xu hướng này như: Trần Đức Chin (2007) nghiên cu vn luyn tư duy thống kê cho HS; Hoàng Nam Hi
(2013) nghiên cu phát trin năng lực suy lun thống (SLTK) cho sinh viên cao đẳng; Qch Th Sen (2020) quan
m đến phát triển duy thống kê cho sinh viên đại hc ngành Dưc; Hoàng Minh (2023) vi nghiên cu xây
dng i trường hc tp ni dung thng tờng THPT theo hướngn luyn năng SLTK cho HS,…
Việc đánh giá kh ng SLTK của HS trong dy học TK&XS cũng được nhiu nhà nghiên cu quan tâm. ơng
t như trong nh vực giáo dc toán hc, việc đánh giá trong dạy hc TK&XS nhằm hướng ti các mc tiêu: Theo
i s tiến b ca HS, ci thiện phương pháp dạy hc, t chc li quá trình hc tp của HS điều chnh ni dung
chương trình ging dy cho phù hp (Garfield & Chance, 2000; Garfield, 2003). Đánh giá kh năng SLTK của HS
trong dy học TK&XS đã thay đổi theo định hưng mi, tp trung vào 3 yếu t chính là hiu biết thng kê, SLTK
duy thống (Garfield & Ben-Zvi, 2008).
Trong bài báo y, chúng tôi s dng Lí thuyết ng đáp câu hỏi hay còn gi “Lí thuyết hồi đáp” (Item Response
Theory - IRT) của Georg Rasch để phân ch đề kim tra kh năng SLTK ca HS THPT thông qua 20 câu hi trc
nghiệm đã đưc y dng. c câu hi nghiên cu đặt ra là: (1) Đề kiểm tra được xây dng p hp đ đánh g
kh năng SLTK của HS hay không?; (2) Thc trng kh ng SLTK của HS THPT như thếo?; (3) Có s khác
biệt đáng kểo v kh năng SLTK gia nhóm HS nam và HS n hay không?
2. Kết quả nghiên cứu
2.1. Khả năng suy luận thống
SLTK th được định nghĩa như ch con người suy lun với c ý tưởng thng làm cho thông tin
thng tr n có ý nghĩa. Điều này ln quan đến việc đưa ra các lí giải da trên các tp d liu, biu din hay các
VJE
Tp chí Giáo dc (2024), 24(19), 18-24
ISSN: 2354-0753
19
s đặc trưng ca d liu. SLTK th bao gm vic kết ni mt khái nim vi mt khái nim khác (chng hạn như:
m, độ phân tán), hay có th kết hp c ý tưởng v d liệu và cơ hội (Garfield et al., 2008). Garfield và Chance
(2000) đã đưa ra một s gợi ý đ thc hiện đánh gkh năng SLTK của HS, bao gm: Nghiên cu tình hung hoc
i tp thc tế; S dụng sơ đồ tư duy; Phê nh các ý tưởng thng kê hoc các vấn đề thng trong tin tc; Viết
o cáo ngn gn; Tr li câu hi trc nghim.
Mc kh ng SLTK có thể đưc đánh giá tốt nht thông qua giao tiếp trc tiếp với HS (nphng vn, quan
t), hoc bng cách xem t mt h sơ hc tp chi tiết, sâu rộng (như dự án thng kê), nhưng các bài kiểm tra đưc
thiết kế càng cũng có thể đưc s dng đ thu thp thông tin v kh ng SLTK của HS. Mt s i đánh giá đã
đưc y dng s dng rộng rãi như: i kiểm tra kh ng SLTK (Statistical Reasoning Assessment - SRA)
gm 20 câu hi trc nghim của Garfield (2003); bài đánh giá toàn diện kết qu trong khóa hc thống kê đầu tiên
gm 40 câu hi trc nghim ca Delmas và cng s (2007); bài kim tra mc tiêu và kết qu liên quan đến hc thng
gm 20 câu hi trc nghim của Sabbag Zieffler (2015);… Trong các i kim tra y, SRA là công c đu
tiên được phát trin và c nhận đ đánh giá một s khía cnh v SLTK ca HS. Trước khi SRA, hu hết c công
c và câu hi được s dụng đều tp trung vào các tính toán ch không phi vào kh năng suy nghĩ và suy luận ca
ngưi hc khi đối mt vi c vn đề TK&XS. Đặc đim chung ca các bài kiểm tra là đều s dng hình thc câu
hi trc nghim nhiu la chn, riêng Garfield (2003)u cu HS phi gii thích cho la chn ca mình. Tuy nhiên,
đối tượng chínhc bài kim tra SLTK trênớng đến sinh viên đại hc.
2.2. ợc về hình Rasch
thuyết trc nghim c đin (Classical Test Theory - CTT) ra đời o khong cui thế k XIX hn thin vào
những năm 60 của thế k XX. Lí thuyết này đưc xây dng da trên khoa hc thng kê và đưc ng dng ch yếu
trong việc phân tích, đánh giá câu hi trc nghim khách quan. Vic đánh giá câu hỏi trc nghim kch quan theo
CTT ch yếu da tn c tham s độ k, độ phân bit h s tương quan ca câu hi với đ thi sau khi kết qu
phn hi của t sinh đi vi các câu hi. CTT giúp đơn giản hóa việc đo lường đánh gđề thi nh kh năng vn
nh mô hình mà không cn gi thiết phc tp. Tuy nhiên, hn chế ln nht ca CTT không tách bit được c
đặc tng của thí sinh đc lp với c đặc trưng của đ thi, đặc trưng này chỉ th gii thích trong mi quan h vi
đặc trưng kia (Lâm Quang Thiệp, 2010). C thể, đặc tng của đ thi khó, đ phân bit, đ tin cy, độ gtr) ph
thuộc o nhóm thí sinh m bài. Do đó, khi áp dụng cho nhóm thí sinh khác, các đặc trưng y sẽ thay đổi, nh
hưởng đến kết qu đánh giá. Năng lực thí sinh cũng biến đổi theo độ khó của đề thi. Ví d, đề d s khiến thí sinh
được đánh giá caong lực và ngược li vi đề khó.
Để khc phc những điểm yếu k trên ca CTT, trong na sau ca thế k XX, nhiu nhà nghiên cu v đo
ng trong giáo dục đã đề xuất và cho ra đời lí thuyết ứng đáp câu hỏi (Item Response Theory - IRT) (Morales,
2009). Lí thuyết ứng đáp câu hỏi được xây dng da trên hai gi thiết: S ứng đáp của một thí sinh đối vi mt
câu hi th được tiên đoán bằng năng lực tim n ca thí sinh; Quan h gia s ứng đáp câu hi ca thí sinh và
năng lực tim ẩn làm sở cho s đáp ứng đó thể t bng một hàm đặc trưng câu hỏi đồng biến (Lâm
Quang Thip, 2010). thuyết ứng đáp câu hỏi IRT nhiều hình, trong đó Rasch hình đơn giản
đưc s dng ph biến. Nhà toán học George Rasch đã xây dựng được một mô hình hàm đặc trưng câu hỏi đơn
giản và được s dng nhiều cho đến ngày nay. Để biu din câu hi, George Rasch ch chn mt tham s độ
khó ca câu hi. Mô hình Rasch da vào gi thuyết sau: Một người có năng lực cao hơn một người khác thì xác
suất để người đó trả lời đúng một câu hi bt kì phi ln hơn xác suất của người sau; cũngơng tự nvy, mt
câu hỏi khó hơn một câu hỏi khác có nghĩa là xác suất để một người bt kì tr lời đúng câu hỏi đó phải bé hơn
xác suất để tr li đúng câu hỏi sau (Georg, 1960).
T gi thuyết trên, có th thy c xut để mt t sinh tr li đúng mt u hi o đó phụ thuộc vào ơng quan
giữa ng lực ca t sinh độ khó ca u hi. Công thc của hình Rasch như sau:
( )
1 / , 1
ij
ij
b
ij i j b
e
P X b e
==
+
; trong đó
năng lực ca thí sinh
i
,
j
b
độ khó ca câu hi th
j
,
ij
X
tr
li ca thí sinh th
i
đối vi câu hi th
j
. Nếu thí sinh tr lời đúng câu hi t
1
ij
X=
, nếu tr li sai thì
0.
ij
X=
Trong mô hình Rasch, xác sut tr lời đúngu hỏi ca thí sinh t l thun với năng lực của thí sinh đó. Xác suất
y s tiến dn v 1 khi năng lực ca tsinh tiến đến ơng ng. Nếu năng lực ca t sinh bng với độ khó ca
u hi thì kh năng trả li đúng câu hỏi ca t sinh đó 50%. Mứcng lựcy được gọi ngưng ca câu hi.
Như vậy, độ khó ca mi câu hi chính là ngưỡng mà vớing lực đó, kh năng tr lời đúng câu hi ca thí sinh là
VJE
Tp chí Giáo dc (2024), 24(19), 18-24
ISSN: 2354-0753
20
50%. Baker (2001) cho rằng, điểm ni bt ca mô hình Rasch là đã mô tả đưc mi liên h giữa ng lực ca mi
thí sinh đối vic tham s đặc tng ca các câu hi thông qua s ứng đáp của mi thí sinh khi tr li các câu hi
trong đ thi.
2.3. Nghn cu thc nghim
2.3.1. Đối tượng, mục đích và phương pháp nghiên cứu thực nghiệm
Đối tượng nghiên cu 108 HS lớp 10 Trường THPT Bình Giang, tnh Hi ơng (xem bng 1). Thc nghim
đưc tiến nh o tháng 4/2024.
Bng 1. Thng đặc điểm đối tượng nghiên cu
Đặc điểm
S ng
T l (%)
Gii nh
Nam
58
53,7
N
50
46,3
Tng
108
100
V gii tính, có 58 HS nam (chiếm 53,7%), 50 HS n (chiếm 46,3%). Có th thy s phân b theo gii tính là
ơng đối đồng đều. ng c đưc s dng trong nghiên cu này mt bài kim tra SLTK gm 20 câu hi trc
nghim. Bài kiểm tra đượcy dng dựa trênc căn cứ: Các loi SLTK biu hin; Ni dungu cu cn đạt
ca mch kiến thức TK&XS theo Chương trình giáo dục ph thông 2018; c bài đánh giá khả năng SLTK của HS.
i kim tra gm 4 ch đề vi s ngc câu hi c th trong như trong bảng 2:
Bng 2. Thành phnc câu hi trong bài kim tra
TT
Ch đề
S ng câu hi
T l (%)
1
Thu thp t d liu
2
10
2
T chc và thu gn d liu
8
40
3
Biu din d liu
2
10
4
Phân tích, din gii d liu và kết lun
8
40
Mc đích của thc nghim là đánh giá khả năng SLTK của HS THPT thông qua mô hình Rasch. Nghn cu
thc nghim s dụng phương pháp đánh giá định ng, các s liệu được x vi phn mm QUEST và SPSS 20.0.
2.3.2. Kết quả nghiên cứu thực nghiệm
- Độ tin cậy của đề kiểm tra và mức độ phù hợp với mô hình Rasch: Kết qu đim kim tra của HS đưc thng
trong bng 3:
Bng 3. Thng kết qu đim kim tra
S ng
Hp l
108
Bt
0
Trungnh
5,694
Trung v
5,500
Độ lch chun
1,3822
Phần trăm
25
4,500
50
5,500
75
6,875
thuyết hi đáp IRT có nhiều mô hình đo lưng khác nhau. Mô hình Rasch ch đưc áp dng nếu d liu làm
i ca HS php với hình này. Đ đánh gsự php, cn xem t hai tiêu chí: Giá tr vng ca c bình
phương trung bình (mean square) gần bng 1 (giá tr chp nhn trong khoảng 0,77 đến 1,3) và độ lch chun (SD)
gn bng 0 (Adams & Khoo, 1996). Các s liu v giá tr trung bình (mean) và độ lch chun (SD) có đưc khi x
d liu bng phn mm QUEST cho thy d liu php vi nh Rasch (xemnh 1).
nh 1. Thông tin tng hp v đ thi thí sinh
VJE
Tp chí Giáo dc (2024), 24(19), 18-24
ISSN: 2354-0753
21
Độ tin cy của đề kim tra (Reliability of estimate) 0,95. Do vy, đây là một đề kiểm tra có độ tin cy cao và
kết qu đo đưc phản ánh đúng khả năng ca HS tham gia làmi.
- Mức đphù hợp của c u hỏi: c u hi phù hp vi hình Rasch nếu có ch s Infit MNSQ nm trong
khong t 0,77-1,30 (Adams & Khoo, 1996). Trong biểu đ Item Fit, mi u hi đưc biu th bng mt du *. Câu
hi phù hp s có du * tương ứng nm giữa hai đưng chm thẳng đứng v trí 0,77 và 1,30. Kết được phân tích
cho thy, tt c cácu hỏi đều phù hp, không câu hi nào b loi b.
- Phân bố khnăng suy luận thống của HS
đkhó câu hỏi: Phn mm QUEST cung cp
mt biu đồ i dng ma trn (xem biểu đồ 1)
cho thy kh năng của 108 HS độ khó ca 20
u hi. Trong đó, các con s n phi đưng k
thng ca biểu đồ là các câu hi, v trí ca s cho
biết độ kcau hi, cácu hi trên đ
khó cao hơn c câu hi i. Mi du X nm
n trái đường k thng ca biu đồ đi din cho
mt HS, v trí ca du X cho biết kh năng SLTK
ca HS ơng ng. Du X phía trên đại din
cho HS kh năng cao hơn.
Quan sát pn b độ khó cau hi và kh
ng của HS cho thy mức độ phù hp của đề thi
đối vi nhng HS d thi. Một đ thi có cht ng tt khi c câu hỏi trong đề thi có độ kơng ng vi kh năng
ca HS, k c nhng HS kh ng thp nhng HS có kh ng cao.
Kh ng của HS độ kca câu hi được đánh giá bằng thang đo logit, kết qu phân tích thu đưc kh năng
ca HS đt gtr trong đon [-1,31; 2,05], độ khó ca câu hỏi đạt giá tr trong đon [-2,13; 1,97]. Câu hi khó nht
trong đ thi u 8, với độ khó 1,97, câu hi d nht là câu 7 với độ khó -2,13. Nhìn trên biểu đ th thy nét
s phân b v đ khóc câu hỏi thi bao trùm đưc kh năng ca HS. Thông tin tng hp v đ thi và thí sinh được
phn mềm QUEST tính toán và thu đưc kh năng trung bình ca mu HS (case estimate) tham gia bài kim tra
0,36, cao n so với độ khó chung ca bài kiểm tra nhưng khoảng chênh lch kng nhiu. Nóich khác, i kim
tra ơng đối phù hp vi kh năng của HS. Kh ng của HS cao n không đáng kể so với đ khó trung nh
ca cácu hi.
Biểu đồ 2 cho thy, kh ng SLTK của nhóm HS phân b khá đồng đu. Có 52 HS (chiếm 48%) có kh ng
trên mc trung bình.
a)
b)
Biểu đồ 2. Biểu đ hp ca điểm kim tra (a) và biến kh năng SLTK (b)
HS kh ng SLTK cao nhất (vi đim s 2,05) HS nam, s u tr li đúng 17/20. HS này m sai c
u 3, 17, 19. HS kh ng SLTK thấp nht (-1,31) là HS nam, s u tr li đúng 5/20. u số 7 được xếp loi
rt d, mức độ khó thấpn nhiều so vi kh năng của HS. Haiu hỏi có độ khó thp nht trong đề thi câu 7
u 2 vi nội dung nsau:
u 7: T 1 gm 10 HS điểm s ca các HSy trong mti kim tran Ng văn n sau:
Đim s
5
6
7
8
9
S HS
3
2
1
2
2
Đim kim tra môn Ng văn trungnh của các HS t 1 bao nhiêu?
A) 6,8; B) 5; C) 6; D) 6,5.
VJE
Tp chí Giáo dc (2024), 24(19), 18-24
ISSN: 2354-0753
22
u hỏi ln quan đến ng đc thông tin t bng s liệu được cho dưới dng bng tn s tính s trung bình
cng. 88,4% HS tr li đúng câu hỏi này. Như vậy, hu hết HS đc hiểu đưc s liu t bng, biết cách nh trung
nh cng thc hin các phép toán chính xác.
u 2: Một nhãn dán được in trên chai thuc có li cảnh báo sau: “Khi bôi thuốc lên da có 15% kh năng bị d
ng ni mn. Nếu b d ng, hãy tham kho ý kiến của bác sĩ”. Điều nào sau đây giải thích đúng nht li cnh báo
y?
A) Không nên s dng loi thucy vì có nhiu kh năng b d ng.
B) Khi bôin da, ch áp dng 15% liềuợng được đ ngh.
C) Nếu b d ng, ch có 15% din tích b mt da b ni mn.
D) Khoảng 15 trên 100 người s dng thuc này b d ng.
u hi yêu cu HS giải thích ý nghĩa của li cnh báo ghi trên mt l thuc rằng có 15% nguy cơ bị phn ng
d ng da khi s dng sn phẩm y. Đ hiểu đúng cảnh báo, HS cn nhn thc đưc rằng15% nguy cơ dị ng” có
nghĩa c suất xy ra phn ng d ng khi dùng loi thuc y 15%; hay nói ch khác, trong 100 người s
dng, khong 15 người s b d ng. Trong câu hi này, 79,5% HS đã hiểu đúng ý nghĩa của cnh báo trên l thuc
tr li chính xác.
Hai câu hi có độ khó ln nht câu 8 câu 10.
u 8:
m 2011, thông tin cho rằng giá ntrung bình Hà Nội đã tăng 20% trong một năm, trong khi trung
vị của giá nlại giảm 2% trong cùng năm đó. Giải tch o sau đây là hợp lí nhất cho thông tin này?
A) Hu hếtc ni n Ni gim giá và mt s ít ngôi nng giá mnh.
B) Giá ca hu hết các ngôi n Ni gim nhiều ngôi n được bán trong năm 2011 hơn so vớim
trước đó.
C) Thông tin chưa chính xác vì nếu giá nhà trung bình tăng thì trung vị giá
nhà cũng phải tăng.
D) Giá ca hu hết các ngôi nhà Nội tăng và có ít ngôi nhà được n
trong năm 2011 hơn so với năm trước đó.
T l HS la chọn các phương án như sau (xem biểu đồ 3). Để tr lời đưc
u hi này, HS cn biết được đặc điểm ca s trungnh và trung v. Gtrung
nh được tính bng ch ly tng giá tr ca tt c c ngôi n chia cho s
ợng ngôi nhà. Do đó, giá trung bình bị ảnh hưởng nhiu bi nhng ngôi nhà
giá tr cao. Trung v giá tr nm gia khi sp xếp g tr ca tt c c ngôi
nhà theo th t t thp đến cao. Do đó, trung vị ít b ảnh hưởng bi nhng ngôi
nhà có giá tr cao hay thp. T đó có th thy mt s ít ngôi nhà đãng giá rất
mnh, dẫn đến việc gtrung bình ng cao, tuy nhiên nhiu ngôi n khác gim
giá dẫn đến vic trung v giá n gim. Ch 17% HS tr li đúng câu hỏi này.
u 10:
9 HS của một lớp học đã tiến nh cân một vật nhỏ trên cùng một cái cân ghi lại khối lượng (tính
bằng gam) của vật đó theo các giá trị như sau: 6,2; 6,0; 6,0; 15,3; 6,1; 6,2; 6,15; 6,2; 6,3. HS cần xác định chínhc
khốing ca vt này. Trong các phương pháp sau đây,c em nên sử dụng phương pháp nào?
A) Ly giá tr 6,15 đó là s đưc lấy chính xác đến hàng phần trăm.
B) Ly trungnh ca 9 giá tr.
C) Loi tr s 15,3, ly trungnh 8 giá tr còn li.
D) Ly giá tr xut hin nhiu nht, đó 6,2.
T l HS la chọn các phương án n trong biu đồ 4. Đây là một tình hung
HS th gp trong thc tin. Để xác định chính xác khi ng ca vt, cn
xem xét c phương pháp đề xut, phân tích do hp hoc không hợp để
đưa ra lựa chn phù hp.
Phương án A: Vic chn mt giá tr duy nht mà không xemt toàn b d
liu có th dẫn đến sai t nếu giá tr đó mt ngoi l, hoc không đi din cho
toàn b d liu.
Phương án B: Phương pháp này không hợp giá tr trung nh b nh
ng bi giá tr ngoi lai 15,3.
Phương án D: Phương pp này không phù hợp không tn dụng được toàn b thông tin t mu s liu.