Y hc Thành ph H Chí Minh * Tp 27 * S 1 * 2024
Nghiên cu Y hc
170
MI QUAN H GIỮA ĐỘ KNG LỰC ĐỘ PN CH
CA U HI TRC NGHIM SINH HC
TRONG C Đ THI TUYN SINH SAU ĐẠI HC
DÀNH CHO ĐỐI TƯNG CHUYÊN KHOA CP I T NĂM 2018 - 2022
TI ĐẠI HC Y DƯC THÀNH PH H C MINH
Phạm Dương Uyn Bình1, Trn Th Diu2, Võ Đăng Khoa3, i Thanh Tú3, Nguyễn Đình Chương4,
Mai Phương Tho4, Nguyn Anh 3, Vĩnh n1, Phm An5
M TT
Mc tiêu: Trong go dc dựa trên năng lc, vic đánh gchínhc năng lực ca thí sinh quan trng
đánh giá g tr và tin cậy thúc đy các hot đng hc tập đảm bảong lực trong cácnh vực ng vic nhm
cung cp cho cng đồng ngun nhân lc đáng tin cậy. Gi đnh truyn thng cho rng các u hi d trong bài
kiểm tra độ phân cách thp, hn chế trong vic phân bit gia hc viên các cấp độ thành tho khác nhau. Tuy
nhiên, nhng bng chng cho thy kh năng phân ch của câu hi có th b ảnh hưởng bi c yếu t khác
n đặc điểm timng ca thí sinh n: môi trưng hc tp, thành tích, v.v… Do đó, nghn cuy phân tích
câu hi trc nghim cai thi tuyn sinh sau đại hc v độ khó và phân ch nhm mc đích phânch mi liên
h phc tp ca đ khó và đ phân cách cũng n đặc điểm tim tàng ca thí sinh trong ng cnh ca đề thi trc
nghim đu vào Chun khoa cp I môn Sinh hc.
Đối tượng phương pháp nghiên cứu: Nghiên cu ct ngang đưc áp dụng để phân tích toàn din 5i
kim tra Sinh hc mi i gồm 120 câu, đưc thc hiện trong vòng 5 năm, t năm 2018 đến 2022. Nghn cu
đã thu thp 3928 kết qu kim tra t một nhóm đa dạng thí sinh d thi sau đại hc. Phân ch u đã đưc thc
hiện để c định đ khó theo CTT và IRT ng ch s phân cách rpbis trên phn mm phân tích Basicstat. Ngi
ra, các phép kim Anova ng để sonh s câu tr li đúng giữa các đặc đim mu khác nhau như trường, xếp
loi tt nghiệp và năm tt nghip vi phn mm SPSS 20.
Kết qu: Phn ln trong s 600u ca bài thi môn Sinh lý hc được phân loi là d hoc rt d. T l câu
hi trong vòng 5 m có ch s phân ch rpbis tt trên 0,3 thuc su d-rt d theo đ khó logit Rasch: 30,8%
đến 43,3% và theo độ khó CTT 52,5 đến 71,1 %. Kết qu phân ch đặc điểm ca mu và s câu m đúng cho
thy s khác bit có ý nghĩa về s u tr li đúng giữa các thí sinh tt nghip t các trường đại hc khác nhau
[F(5,3921) = 36,694, p < 0,001], xếp loi tt nghip [F(5, 3921) = 241,237, p < 0,001] năm tốt nghip khác
nhau [F(3,3923) = 36,082, p < 0,001].
Kết lun: T l khá cao cácu hi MCQ d trong 5 bài kim tra có đ phânch tt. Điu y làm ni bt
mi quan h phc tp giữa độ khó và đ phân cách câu. S kc bit v trường đã học, hc lc, v.vđối vi đim
s minh chng cho tn tại đặc đim tiềm tàng (năng lc) ca thí sinh.
T khóa: độ khó, logit, độ phân cách, rpbis, CTT, IRT, Rasch
1Phòng Đảm bo chất lượng, Đại học Y Dược TP. H Chí Minh
2B môn Tin hc, Khoa Khoa hc cơ bản, Đại hc Y Dược TP. H Chí Minh
4Phòng Đào tạo Sau Đại học, Đại hc Y Dược TP. H Chí Minh
3B môn Toán, Khoa Khoa học cơ bản, Đi học Y Dược TP. H Chí Minh
5Trung tâm Y học Gia đình, Đi học Y Dược TP. H Chí Minh
Tác gi liên lc: TS. Phm Dương Uyn Bình ĐT: 0961156505 Email: uyenbinh@ump.edu.vn
Tp chí Y hc Thành ph H Chí Minh, 27(1):170-176. DOI: 10.32895/hcjm.m.2024.01.24
Nghiên cu Y hc
Y hc Thành ph H Chí Minh * Tp 27 * S 1 * 2024
171
ABSTRACT
EXPLORING THE COMPLEX RELATIONSHIP BETWEEN ITEM DIFFICULTY AND
DISCRIMINATION INDEX IN PHYSIOLOGY MCQS IN THE POST-GRADUATE ADMISSION TEST
FOR 1ST SPECIALIST FROM 2018 TO 2022 AT UNIVERSITY OF MEDICINE AND PHARMACY
IN HO CHI MINH
Pham Duong Uyen Binh, Tran Thi Dieu, Vo Dang Khoa, Bui Anh Tu, Nguyen Dinh Chuong,
Mai Phuong Thao, Nguyen Anh Vu, Vinh Son, Pham Le An
* Ho Chi Minh City Journal of Medicine * Vol. 27 - No. 1 - 2024: 170 - 176
Objectives: In competency-based education, accurate assessment of candidates' abilities is important because
valid and reliable assessments promote learning activities and ensure competency in specific areas of work to
reliably provide the community with human resources. The traditional assumption is that easy questions on a test
will have low separation, limited in their ability to differentiate between students at different proficiency levels.
However, there is evidence that the ability of questions to separate can be influenced by factors other than question
difficulty such as candidate's potential characteristics such as learning environment, achievement, etc. Therefore,
this study analyzes the multiple-choice questions of the graduate admission test in terms of difficulty and
separation with the aim of analyzing the complex relationship of difficulty and separation as well as the
underlying characteristics. of candidates in the context of the Physiology exam to enroll in the Level I specialist
doctor training program.
Methods: A cross-sectional study was done to thoroughly assess 5 Physiology examinations, each consisting
of 120 questions. The tests were administered over a period of 5 years, from 2018 to 2022. The study gathered
3928 answers sheet from a varied cohort of graduate examinees. Analyzed sentences were evaluated for difficulty
using both Classical Test Theory (CTT) and Item Response Theory (IRT), as well as the rpbis discriminant index
on the Basicstat analysis software. Furthermore, Anova tests were employed to assess the quantity of accurate
responses among several sample attributes, including as school, graduation classification, and year of graduation,
utilizing SPSS 20 program.
Results: The majority of the 600 questions on the Physiology exam were classified as easy or very easy.
Proportion of questions within 5 years with good rpbis discriminant index above 0.3 among easy -very eassy
questions according to Rasch logit difficulty: 30.8% to 43.3% and according to CTT difficulty 52.5 to 71.1%. The
results of analyzing the characteristics of the sample and the number of correct answers show a significant
difference in the number of correct answers between candidates graduating from different universities [F(5,3921)
= 36.694, p <0.001], graduation rank [F(5, 3921) = 241.237, p <0.001], and graduation year differed [F(3,3923) =
36.082, p < 0.001].
Conclusions: A significant proportion of the multiple-choice questions (MCQ) in the 5 physiological tests in
5 years have good rpbis discriminant index, which highlights the complex relationship between difficulty and
sentence discriminant. The difference in school attended, academic performance, etc. in the test sum scores proves
the existence of latent trait (abilities) of candidates.
Keywords: item difficulty, item 27% discrimination, rpbis, reliability, Classical Test Theory, Items Respone
Theory, Rasch
ĐẶT VẤN ĐỀ
n Sinh lý hc thuc khi kiến thc y hc
sở, vai trò quan trng đầu vào đối vi
người hc thuc khi ngành khoa hc sc khe,
gii thích hot động chc năng của cơ thể
trng thái nh thường. n Sinh hc đưc
ging dạy trong giai đon tiềnm sàng; được
vn dng để giải thích chế bnh , triu
Y hc Thành ph H Chí Minh * Tp 27 * S 1 * 2024
Nghiên cu Y hc
172
chng bnh, làm tin đề cho vic chn đoán
điu tr trong đào tạo những m học lâm sàng
v sau. vy, bài thi môn Sinh lý hc được la
chọn để m môn thi tuyển sinh đánh giá ng
lc đu o ca người d tuyn o các bc đào
to sau đi hc trong các tng Y sinh.
Trong giáo dc da trên năng lực, đánh giá
ng lực hc vn đu vào đưc c trng nhiu
n vì đánh giá hp l đáng tin cy thúc đẩy
c hoạt động hc tập đảm bảong lực hn
thành công vic trong tương lai. Các bài kim tra
thành qu hc tp MCQ ng c đo ng
thành qu hc tp ca người hc mức đ
ng lc nhn thc ca h trong các n hc
kc nhau trong chương trình đào tạo Y sinh.
Khi thiết kế các i kim tra như vậy quan trng
cân nhắc độ khó và đ phân ch ca c câu
hi, chúng ảnh hưởng trc tiếp đến gtr và
độ tin cy ca i kim tra đánh giá. Theo quan
niệm đo lường truyn thng mi quan h
giữa độ k ch s phân ch, u MCQ
ởng thưng kh ng phân ch cao ng
như đ k trung bình, c u MCQ q d hay
quá khó trong i kim tra du hiu ca phân
ch thp, không phân biệt đầy đ gia c thí
sinh có trình độ khác nhau cn ci thin(1). Tuy
nhn, c nghn cu gn đây bắt đầu chng
minh rng mi quan h gia độ khó ca câu hi
ch s phân cách phc tp n(2). Nói ch
kc gi đnh y có th không đúng đi vi tt
c c tng hp cho thy các câu hi mức đ
nh và hiu mc được đánh g dễ” n so
vi u hi mc độ áp dng, nhưng lại th
pn bit tt hơn gia nhng ngưi hc tng
đim cao đim thp(3).
Các tham s u hi MCQ bao gồm đ khó
theo mô nh CTT IRT, ng độ phân ch.
Theo lý thuyết trc nghim c đin CTT, độ
k là t l người làm đúng u trắc nghim chia
cho tng s người tham gia m i trc
nghim(4). Độ pn ch D 27% cho thy dy
lp đánh giá la chn câu cho ngân hàng u do
đơn giản có th tinh vi máy nh cm tay
rpbis cho các cấp độ cao n như khoa trường
quc gia do tính chính xác n(5).
Theo thuyết đáp ng câu hi (Items
Response Theory) độ khó ca câu hi mt
tham s th hin mức độ khó ca mt câu hi
đối với người làm bài, thường đưc tính bng
điểm trên thang đo năng lc logit người
làm bài 50% kh năng trả lời đúng câu hỏi.
Các hình IRT gi định rng kh năng
người làm bài tr lời đúng câu hỏi tăng lên khi
năng lực ca h tăng lên(6). d, mt câu hi
có tham s độ khó cao mt câu hi ch
những người làm bài năng lực cao mi
kh năng trả lời đúng. Một câu hi tham s
độ khó thp mt câu hi ngay c nhng
người làm bài năng lực thấp cũng kh
năng trả lời đúng. Đ khó ca câu hi mt
tham s quan trng trong IRT cho phép
to ra các bài kiểm tra được điều chnh theo
mức độ năng lực của người làm bài. tưởng
nht là, nếu h thng phân cp câu hỏi đại
din cho mt phạm vi năng lực đầy đủ các
câu hỏi thường s dao động t −2 đến +2 logit
vi giá tr logit càng thp thì câu hi càng d(6).
Bên cạnh đó, chỉ s phân cách (rpbis) trên 0,3
cho thy s phân bit hiu qu gia các ng
viên mnh và yếu hơn, góp phần vào kh năng
đánh giá năng lc tng th ca thí sinh thông
qua k thi.
Ngoài ra n th nhng yếu t khác
góp phn vào kh năng pn biệt ng lực
người hc, yếu t đặc đim tim ng ca thí
sinh ít được tìm hiu trong c nghiên cu đánh
g cht ng bài kim tra. Đặc điểm tim tàng
nhng kh ng, phm chất, hay năng lc n
u trong mỗi con người, tuy không th nhìn
thy bng mt thường nhưng lại đóng vai trò
quan trng trong việc định nh tương lai của
mi người(7). c điểm tim ng th kh
ng học tp, thời điểm tt nghip môi
trường hc tp(8). Trong đo ờng đánh giá,
đặc đim tiềm tàng đưc hé l thông qua các bài
kim tra bài tập đưc thiết kế cn thận để
đánh giá năng lực ca mi nhân để hoàn
thành ng vic đưc thiết kế trong chương
Nghiên cu Y hc
Y hc Thành ph H Chí Minh * Tp 27 * S 1 * 2024
173
trình hun luyn.
Do đó, nghiên cứu ca chúng tôi nhm:
Khám phá mi quan h giữa độ khó và ch
s phân cách ca câu hi trong b đề thi trc
nghim đầu o Chuyên khoa cp I môn Sinh
hc và m hiểu các đặc đim tim ng ca thí
sinh ảnh hưởng đến kh năng pn cách ca câu
trc nghim.
ĐI TƯNG - PHƯƠNG PHÁP NGHIÊN CU
Đi tưng nghn cu
Sinh viên tt nghip t nhiều tờng đại hc
y khoa Vit Nam. Nghiên cu đưc thc hin
trong khong thời gian 5 m, từ m 2018 đến
m 2022 đã thu thp 3928 i kim tra, và vic
pn tích c câu hi trc nghim mt đáp án
vi mi câu có 4 la chn theo hai nh CTT
IRT.
Phương pháp nghiên cu
Thiết kế nghiên cu
Mt nghiên cu ct ngang s dng để
phân tích 120 câu bài kim tra Sinh hc thi
đầu vào Chuyên khoa cp I trên đối tượng
sinh viên tt nghip t nhiều trường đại hc Y
khoa Vit Nam.
ng c
Các câu hi trc nghim Sinh học đưc s
dng trong k thi đầu o sau đại hc trong 5
m từ 2018 đến 2022 đã được pn tích, mi i
gm 120 câu một câu đúng ba lựa chn.
Ch s đ khó trong nh IRT (trên thang đo
logit) ch s phân bit (rpbis) nh CTT, đã
đưc s dng để đánh giá c câu hi trc
nghim vi phn mm BasicStat ca Đại hc Y
c Tnh ph H Chí Minh, ng c phn
mm thống kê phân tích như Microsoft Excel,
SPSS 20.
Đ khó ca các u hi trc nghim Sinh hc
Độ ku hi theo Lý thuyết c đin (CTT)
Đ k p bng t s phần trăm thí sinh m
đúng u hỏi trên tng s thí sinh tham gia làm
u hỏi đó. Độ khó p cho biết t l thí sinh tr li
đúng câu hi nhiu hay ít. Gtr p ng ln thì
u hi ng d:
p = s thí sinh làm đúng/số t sinh làm i
Độ khó da trên thang logit theo Lý thuyết ng đáp
câu hi (IRT)
Lý tưởng nht, nếu h thng pn cp câu
hi đại din cho mt phạm vi ng lực đầy đ
các u hi thường s dao đng t −2 đến +2
logit. Logit đơn vị đo lường thang đo khoảng
dc theo thang đo khong thu được t pn tích
Rasch. Da trên thang đo logit, chúng tôi tập
trung vào 2 phân loi ch s độ khó bao gm câu
hi d (thang đo logit t -0,1 đến -1); u hi rt
d (thang đo logit nh hơn -1).
Đ pn cách rpbis đưc chn thay cho D 27%
do k thi cp quc gia và tính bng ch so nh
đim trung nh tng th ca nhng người tr
li đúng u hỏi với điểm trung nh tng th
ca những người tr li sai rpbis 0,3 đưc cho
ch s pn ch tt.
Thng kê
Thng mô t đã đưc s dng để phân
ch d liu. Ch s độ k theo thang đo logit và
ch s phân bit rpbis đưc nh toán bng phn
mm BasicStat. t t l phn trăm Phân
ch phương sai một chiu (One-way ANOVA)
đưc thc hin để đánh giá mối quan h gia
xut thân tng tt nghiệp đi hc, xếp loi tt
nghiệp, năm tốt nghip s câu tr lời đúng.
KT QU
Qua 5 năm, đề thi tuyển sinh sau đại hc
môn Sinh hc s câu hi n đnh 120 câu
vi 4 la chn. S thí sinh d thi ng nhiều qua
5 năm t 549 thí sinh năm 2018 đến 992 t sinh
m 2022 (Bng 1).
Bng 1. Đặc điểm dân s nghiên cu
2018
2019
2020
2021
2022
549 (13,98%)
692 (17,62%)
914 (23,27%)
781 (19,88%)
992 (25,25%)
120
120
120
120
120
Y hc Thành ph H Chí Minh * Tp 27 * S 1 * 2024
Nghiên cu Y hc
174
2018
2019
2020
2021
2022
4
4
4
4
4
Xếp loi tt nghip bc đại hc
216 (5.48%)
1912 (48.49%)
1692 (42.91%)
123 (3.12%)
Năm tt nghiệp đại hc
958 (5.5%)
1293 (48.69%)
909 (43.09%)
767 (3.13%)
Bng 2. T l câu hi d rt d đ phân ch rpbis ≥0,3
Năm
rpbis 0,3 (N=120)
Đ khó logit Rasch
Đ khó CTT
-1~-0,1
<-1
T
l
(%)
0,6~0,8
≥0,8
T
l
(%)
2018
28
09
30,8
19
44
52,5
2019
31
15
38,3
26
44
58,3
2020
29
14
35,8
27
45
60
2021
36
13
40,8
24
62
71,6
2022
33
19
43,3
26
52
65
Bng 3. S khác bit v s câu đúng với các đặc điểm ca thí sinh
M
SD
Trung nh khác bit
Khong tin cy
p value
Trường tt nghip đại hc
Trường tt nghip 1
91,80
15,01
Trường tt nghip 2
86,16
17,97
5,64*
3,25 ~ 8,05
<0,001
Trường tt nghip 3
97,36
13,52
-5,56*
-8,08 ~ -3,04
<0,001
Trường tt nghip 4
92,08
16,05
-0,27
-2,41 ~ 1,86
0,999
Trường tt nghip 5
87,25
17,68
4,55*
1,90 ~ 7,20
<0,001
Trường tt nghip 6
86,99
18,00
4,81*
2,38 ~ 7,25
<0,001
Xếp loi tt nghip bc đại hc
Gii
102,01
10,77
Khá
95,19
13,89
0,54
0,38 ~ 0,71
<0,001
Trung bình k
84,69
17,09
1,23
1,06 ~ 1,39
<0,001
Trung bình
73,20
17,75
1,88
1,61 ~ 2,15
<0,001
Năm tt nghiệp đại hc
2018 - 2022
92,32
15,75
2016 - 2017
93,22
14,88
-0,89
-2,69 ~ 0,89
0,570
2014 - 2015
88,58
17,41
3,74*
1,79 ~ 5,69
<0,001
2013 v trưc
86,38
18,22
5,94*
3,90 ~ 7,98
<0,001
Trong ng 5 m, mi m đề thi 120
u, kết qu cho thy mộtng u hi ch s
pn bit rpbis tt (≥0,3) nhưng xếp loi d và rt
d theo nh CTT, dao động t 52,5% đến
71,6%. Tương t trên mô hinh IRT độ khó theo
thang logit, câu hi d khó logit thp t -1
đến -0,1) rt d k logit rt thp dưi -1)
dao động t 30,8% đến 43,3%. Điều này cho thy
trong các câu có phân cách tt t t l s câu d
rt d theo hình CTT nhiều n theo mô
nh IRT (Bng 2).
Kết qu pn ch cho thy s khác bit
đáng kể gia c nhóm trưng tt nghip đại
hc [F(5,3921) = 36,694, p <0,001]. Kim tra Tukey
HSD sau kim đnh cho thy s câu tr li đúng
ca thí sinh tt nghip (TN) t tng đại hc