ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC GIÁO DỤC
------------ ------------
TRẦN VĂN THANH
TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN LỚP
12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU HỎI NHỊ PHÂN,
ĐA PHÂN VÀ ĐA CHIỀU
LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC
Hà Nội - 2017
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC GIÁO DỤC
------------ ------------
TRẦN VĂN THANH
TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN
LỚP 12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU
HỎI NHỊ PHÂN, ĐA PHÂN VÀ ĐA CHIỀU
CHUYÊN NGÀNH: ĐO LƢỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC
Mã số: 8140115
LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC
Ngƣời hƣớng dẫn khoa học: GS.TSKH. LÂM QUANG THIỆP
Hà Nội - 2017
LỜI CAM ĐOAN
Tôi xin cam đoan, Luận văn Thạc sĩ Đo lƣờng và đánh giá trong giáo dục với
đề tài: “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề tổng
hợp với các câu hỏi nhị phân, đa phân và đa chiều” là công trình nghiên cứu
riêng của tôi, dƣới sự hƣớng dẫn của GS.TSKH. LÂM QUANG THIỆP.
Tôi xin cam đoan:
- Luận văn là sản phẩm nghiên cứu của tôi
- Các thông tin, số liệu, kết quả nghiên cứu trong luận văn là trung thực và chƣa
từng đƣợc ai công bố trong bất kỳ phƣơng tiện thông tin đại chúng nào trƣớc đây.
Tôi xin chịu trách nhiệm về kết quả nghiên cứu của mình
Tác giả luận văn
Trần Văn Thanh
i
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn trân trọng đến những ngƣời đã giúp đỡ tôi hoàn thành
luận văn này.
Trƣớc hết, tôi xin trân trọng cảm ơn các lãnh đạo Trƣờng Đại Học Giáo dục,
Bộ môn Đo lƣờng và đánh giá, các thầy, cô của trƣờng Đại Học Giáo dục đã tận
tình giảng dạy, hƣớng dẫn và giúp đỡ tôi trong quá trình học tập, nghiên cứu và làm
luận văn.
Tôi xin bày tỏ sự biết ơn sâu sắc đến: GS.TSKH. Lâm Quang Thiệp, thầy
đã tận tâm giúp đỡ, hƣớng dẫn tôi trong quá trình nghiên cứu, thực hiện đề tài. Đặc
biệt trong những lúc tôi gặp khó khăn về định hƣớng, động lực nghiên cứu, thầy đã
động viên và hƣớng dẫn tôi cặn kẽ.
Tôi xin chân thành cảm ơn đồng nghiệp, gia đình và bạn bè đã luôn động
viên, khuyến khích tôi trong suốt quá trình học tập và nghiên cứu.
Xin chân thành cảm ơn
Tác giả luận văn
Trần Văn Thanh
ii
MỤC LỤC
Trang
LỜI CAM ĐOAN
LỜI CÁM ƠN
MỤC LỤC
vi DANH MỤC CÁC TỪ VIẾT TĂT ………………………………………….
vii DANH MỤC CÁC HÌNH VẼ ……………………………………………….
DANH MỤC CÁC BẢNG BIỂU …………………………………………… viii
MỞ ĐẦU …………………………………………………………………… 1
1. Lý do chọn đề tài …………………………………………………………. 1
2. Mục đích nghiên cứu ……………………………………………………... 2
3. Đối tƣợng và khách thể nghiên cứu ………………………………………. 3
4. Câu hỏi nghiên cứu và giả thuyết nghiên cứu ……………………………. 3
5. Phƣơng pháp nghiên cứu …………………………………………………… 4
6. Giới hạn và phạm vi nghiên cứu …………………………………………. 4
7. Cấu trúc của luận văn …………………………………………………… 4
Chƣơng 1: Cơ sở lý luân và tổng quan vấn đề nghiên cứu …………………. 5
1. 1. Tổng quan về đo lƣờng trong giáo dục ………………………………… 5
1.1.1. Các khái niệm cơ bản về đo lƣờng đánh giá …………………………. 5
1.1.2. Các phƣơng pháp đo lƣờng trong giáo dục …………………………… 7
1.1.3. Đánh giá kết quả học tập của học sinh ……………………………….. 8
1.1.4. Công cụ đo lƣờng kết quả học tập ……………………………………. 9
1.1.5. Sơ lƣợc về khoa học đo lƣờng đánh giá trên thế giới và Việt Nam ….. 12
1.2. Lý thuyết đánh giá cổ điển ……………………………………………… 15
1.2.1. Các tham số đặc trƣng của câu hỏi trắc nghiệm và phân tích đề trắc 16 nghiệm ……………………………………………………………………….
1.2.2. Điểm số học tập ………………………………………………………. 20
1.3. Lý thuyết ứng đáp câu hỏi ……………………………………………… 24
iii
1.3.1 Tổng quan về lý thuyết ứng đáp câu hỏi ……………………………… 24
1.3.2. Hàm đặc trƣng câu hỏi ……………………………………………….. 25
1.3.3. Điểm thực và đƣờng cong đặc trƣng đề trắc nghiệm ……………........ 29
1.3.4. Hàm thông tin của câu hỏi và của đề trắc nghiệm ……………………. 30
1.3.5. Ƣớc lƣợng năng lực thí sinh và tham số câu hỏi ……………………... 33
1.3.6. So bằng và kết nối các đề trắc nghiệm ……………………………. … 33
1.3.7. Về trắc nghiệm đa phân và trắc nghiệm đa chiều …………………. … 34
1.3.8. Ví dụ về ƣớc lƣợng tham số câu hỏi ………………………………. … 38
Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi …………………………... 47
2.1. Đặt vấn đề ……………………………………………………………… 47
2.2. Quy trình xây dựng một đề thi, đề kiểm tra ……………………………. 47
2.2.1. Qui trình xây dựng ngân hàng câu hỏi trắc nghiệm khách quan ……... 49
2.2.2. Quy trình triển khai một kỳ thi trắc nghiệm khách quan …………….. 50
2.3. Xây dựng đề thi môn toán ……………………………………………… 52
2.3.1. Chuẩn bị ………………………………………………………………. 53
2.3.2. Xây dựng bảng ma trận trọng số ……………………………………… 53
2.3.3. Biên soạn câu hỏi thi …………………………………………………. 60
2.4. Thử nghiệm đề thi ………………………………………………………. 66
2.4.1. Chọn mẫu nghiên cứu ………………………………………………… 66
2.4.2. Kế hoạch thực hiện …………………………………………………… 66
2.4.3. Kết quả thử nghiệm …………………………………………………… 66
Chƣơng 3: Kết quả nghiên cứu ……………………………………………… 68
3.1. Giới thiệu ……………………………………………………………….. 68
3.2. Phân tích tham số câu hỏi thi …………………………………………… 69
3.2.1. Phân tích câu hỏi thi bằng CTT ………………………………………. 70
3.2.2. Phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại ……………….. 71
3.2.3. Phân tích câu hỏi thi đa chiều ………………………………………… 80
3.2.4. Phân tích câu hỏi thi đa phân ………………………………………… 85
3.3. Một số kết quả phân tích câu hỏi thi ……………………………………. 85
iv
3.3.1. Quy trình hiệu chuẩn đề kiểm tra …………………………………….. 85
3.3.2. Các đặc trƣng về các đề thử nghiệm …………………………………. 86
KẾT LUẬN ………………………………………………………………..... 91
KHUYẾN NGHỊ …………………………………………………………..... 92
DANH MỤC TÀI LIỆU THAM KHẢO …………………………………… 93
PHỤ LỤC …………………………………………………………………… 94
Phụ lục 1: Phân phối chƣơng trình toán Lớp 12 …………………………… 94
Phụ lục 2: Phụ lục 2: Mẫu đặc tả kiến thức môn toán 12 theo chuẩn kiến 95 thức kĩ năng bộ giáo dục ban hành. ………………………………………….
Phụ lục 3: Định dạng biên soạn câu hỏi thi. ………………………………… 100
Phụ lục 4: Đặc tả nội dung kiến thức từng câu hỏi theo ma trận trọng số 101 trong đề thi. ………………………………………………………………….
Phụ lục 5: Đề thi thử nghiệm 01 . …………………………………………… 106
v
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt Ý nghĩa
Bộ giáo dục BGD
Câu hỏi CH
Classical Test Theory CTT
Độ khó vừa phải ĐKVP
Đặc trƣng câu hổi ĐTCH
Đề ttrắc nghiệm ĐTN
Học sinh HS
Item response theory IRT
Item Curve Function ICF
NHCH Ngân hàng câu hỏi
Partial Credit Model PCM
Trung học phổ thông THPT
Tự luận TL
TNKQ Trắc nghiệm khách quan
Trắc nghiệm TN
Thí sinh TS
vi
DANH MỤC CÁC BẢNG BIỂU
Tên bảng Trang STT
1 Bảng 1.1 So sánh ƣu nhƣợc điểm của đề thi TNKQ và tự luận 10
2 Bảng 1.2 Hình thức thi TNKQ và tự luận 10
3 Bảng 1.3 Mô tả câu nhóm các câu hỏi trắc nghiệm 19
4 Bảng 1.4 Dữ liệu thử nghiệm của câu hỏi thi 41
5 Bảng 1.5 Dữ liệu tính toán ƣớc lƣợng hàm đặc trƣng câu hỏi 43
6 Bảng 1.6 Dữ liệu tính toán ƣớc lƣợng hàm đặc trƣng câu hỏi 43
7 Bảng 2.1 Quy trình xây dựng đề thi 52
8 Bảng 2.2 Ma trận đề thi môn toán 12 54
9 Bảng 2.3 Bảng mô tả chi tiết từng câu hỏi trong đề thi 55
10 Bảng 2.4 Quy trình biên soạn câu hỏi thi 60
11 Bảng 2.5 Bảng xây dựng câu hỏi thi 61
12 Bảng 2.6 Mẫu lƣu kết quả câu hỏi thi 67
13 Bảng 3.1 Độ khó P của một câu hỏi trắc nghiệm số 1. 70
14 Bảng 3.2 Bảng tham số các hỏi thi về mức độ phù hợp 71
15 Bảng 3.3 Phân tích đa chiều năng lực của TS với đề thi 01. 81
vii
DANH MỤC CÁC HÌNH VẼ
Tên hình vẽ Trang STT
1 Hình 1.1. Đƣờng cong ĐTCH một tham số 26
Hình 1.2. Các đƣờng cong ĐTCH hai tham số với các giá trị a khác 2 27 nhau
Hình 1.3. Các đƣờng cong ĐTCH 3 tham số với a = 2, c = 0,1 và 3 28 0,2.
Hình 1.4. Đƣờng cong đặc trƣng của ĐTN gồm 5 CH và 5 đƣờng 4 30 cong ĐTCH tƣơng ứng.
Hình 1.5. Các đồ thị hàm thông tin của 5 CH trắc nghiệm và của 5 31 ĐTN do 5 CH đó hợp thành
Hình 1.6. Các đƣờng cong ĐTCH trắc nghiệm nhị phân ứng với xác 6 36 suất trả lời sai
Hình 1.7. Các đƣờng cong ĐTCH của một CH PCM có 3 hạng điểm 7 36 (với δ1<δ2).
8 37 Hình 1.8. Mặt ĐTCH với 2 chiều năng lực θ1,θ2
Hình 1. 9. Hai kiểu biểu hiện tính đa chiều của các câu hỏi trắc 9 37 nghiệm.
10 Hình 1.10. Mô tả đáp ứng câu hỏi 39
11 Hình 1.11. Hàm đặc trƣng câu hỏi 40
12 Hình 1.12. Ƣớc lƣợng hàm đặc trƣng của câu hỏi 41
13 Hình 1.13. Tham số ƣớc lƣợng của câu hỏi 42
14 Hình 1.14. Đồ thị hàm đặc trƣng của câu hỏi 42
15 Hình 1.15. Đồ thị của hàm đặc trƣng câu hỏi 44
Hình 1.16. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có 16 45 năng lực thấp
Hình 1.17. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có 17 45 năng lực cao
viii
Hình 1.18. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có 18 45 năng lực phổ quát
19 Hình 3.1. Đồ thị hàm đặc trƣng câu hỏi số 4. 73
20 Hình 3.2. Đồ thị hàm đặc trƣng câu hỏi số 21 73
21 Hình 3.3. Đồ thị hàm đặc trƣng câu hỏi số 39 74
22 Hình 3.4. Đồ thị hàm đặc trƣng câu hỏi số 40 74
23 Hình 3.5. Bản đồ phân bố độ khó câu hỏi thi và năng lực thí sinh 75
24 Hình 3.6. Đƣờng cong đặc trƣng của đề thi số 1. 77
25 Hình 3.7. Hàm thông tin của đề thi số 1. 78
26 Hình 3.8. Hàm thông tin của đề thi số 2. 78
27 Hình 3.9. Hàm thông tin của đề thi số 3. 79
28 Hình 3.10. Hàm thông tin của đề thi số 4. 79
29 Hình 3.11. Năng lực giải tích của TS 82
30 Hình 3.12. Năng lực đại số của TS 83
31 Hình 3.13. Năng lực hình học của TS 84
Hình 3.14. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 32 87 của đề thi 01
Hình 3.15. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 33 88 của đề thi 02
Hình 3.16. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 34 89 của đề thi 03
Hình 3.17. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 35 90 của đề thi 04
ix
MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay có hai hình thức thi cử kiểm tra chủ yếu trong các cơ sở giáo dục là
trắc nghiệm khách quan và tự luận.
Việc kiểm tra đánh giá ở các nhà trƣờng từ trƣớc đến nay phần lớn đều sử dụng
phƣơng pháp kiểm tra bằng hình thức tự luận. Phƣơng pháp này có ƣu điểm nổi bật là
ít tốn thời gian ra đề; đánh giá đƣợc khả năng trình bày, diễn đạt của học sinh; khuyến
khích học sinh rèn luyện khả năng tƣ duy logic, khả năng suy diễn, tổng quát hóa, phát
huy óc sáng tạo của học sinh. Tuy vậy kiểm tra bằng tự luận cũng tồn tại nhiều hạn chế
nhƣ không thể kiểm tra đƣợc một cách đầy đủ các kiến thức và kỹ năng của học sinh
dẫn đến tình trạng học tủ, học lệch. Kết quả kiểm tra đánh giá không đảm bảo tính
chính xác, khách quan mà phụ thuộc nhiều vào đánh giá chủ quan của ngƣời chấm.
Hơn nữa, việc chấm điểm tốn rất nhiều thời gian và công sức, đặc biệt là với số lƣợng
lớn.
Hình thức kiểm tra trắc nghiệm cũng đƣợc triển khai trên thế giới từ những năm
đầu thế kỷ 20, và đƣợc du nhập vào nƣớc ta tại một số thời điểm trƣớc năm 75 ở miền
Nam. Đặc biệt bộ giáo dục (BGD) đã bắt đầu đƣa vào kì thi Quốc gia với các môn Lí,
Hóa, Sinh, Ngoại ngữ từ năm 2007 và các môn Toán, Sử, Địa từ năm 2017 hình thức
thi trắc nghiệm khách quan. Các ƣu điểm nổi bật của kì thi đã đƣợc chứng minh nhƣ
khách quan, công bằng, tiết kiệm thời gian, tiền bạc. Tuy vậy việc đƣa kì thi vào tƣơng
đối vội vàng, chƣa có chuẩn bị đào tạo một cách bài bản nên gây nhiều khó khăn cho
giáo viên, học sinh trong các khâu kiểm tra, đánh giá. Đặc biệt hơn do chƣa có kinh
nghiệm nên các đề thi trắc nghiệm khách quan đƣợc biên soạn chủ yếu với đo đƣợc
kiến thức ở mức nhận biết, thông hiểu, còn các thang kiến thức ở mức áp dụng, phân
tích, tổng hợp chƣa đo lƣờng một cách chính xác. Điều đó là một phần khó khăn cho
việc phân loại học sinh với các môn tƣ duy logic cao nhƣ môn toán.
Việc học và thi trên thế giới đã diễn ra hàng nghìn năm trƣớc đây, nhƣng một
khoa học về đo lƣờng trong giáo dục thật sự có thể xem nhƣ bắt đầu từ thế kỉ XX, tại
châu Âu và phát triển mạnh khi du nhập vào Hoa Kỳ [3, tr. 51].
Trong đo lƣờng giáo dục, hai hệ lý thuyết đánh giá cơ bản đang đƣợc sử dụng:
1
Lý thuyết đánh giá cổ điển (Classical Test Theory - CTT)
Lý thuyết đánh giá hiện đại (Modern Test Theory)
Hiện nay cách thức xây dựng đề thi đa số dựa theo lý thuyết đánh giá cổ điển,
nhƣng cách phân tích đánh giá câu hỏi thi, đề thi thƣờng kết hợp cả lý thuyết đánh giá
cổ điển lẫn lý thuyết đánh giá hiện đại. Hai hình thức đánh giá này thƣờng bổ xung các
ƣu nhƣợc điểm cho nhau nên chúng thƣờng đƣợc sử dụng đồng thời. Một trong những
trở ngại của lý thuyết khảo thí cổ điển là vấn đề chọn mẫu, chuẩn hóa và so bằng. Lý
thuyết khảo thí hiện đại, thƣờng đƣợc gọi là lý thuyết ứng đáp câu hỏi (IRT) hoàn toàn
dễ dàng khắc phục các khó khăn này nhƣng lại có những tính toán ƣớc lƣợng phức tạp.
Khoảng hai chục năm gần đây, các nghiên cứu sâu về IRT diễn ra ở nhiều nơi trên thế
giới đặc biệt là Hoa Kì. Tuy vậy các bài viết về IRT chủ yếu mang tính lí thuyết, nặng
nề về các công thức toán học nên việc triển khai, ứng dụng IRT trong công tác xây
dựng đề là chƣa nhiều, chủ yếu sử dụng IRT trong công việc phân tích đánh giá đề thi.
Lý thuyết đo lƣờng hiện đại đã dần chứng tỏ các ƣu điểm của nó so với lý
thuyết đo lƣờng cổ điển. Hiện nay các công cụ hỗ trợ tính toán phức hợp (máy tính
điện tử, phần mềm chuyên dụng,…) đƣợc phổ biến thì nhu cầu ứng dụng các kết quả
nghiên cứu của lý thuyết khảo thí hiện đại vào thực tế ra đề thi trong các kì thi quốc
gia hay trong các nhà trƣờng phổ thông càng trở nên bức thiết. Với mong muốn lý
thuyết IRT sớm đƣợc phổ biến trong công tác khảo thí đo lƣờng ở Việt Nam, tôi chọn
nghiên cứu đề tài “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề
tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều” nhằm thiết kế bộ đo năng lực
môn toán của học sinh phổ thông, kiểm tra đánh giá đƣợc một cách hệ thống và toàn diện
kiến thức và kỹ năng của học sinh sau khi học xong môn toán lớp 12. Đồng thời đƣa ra
một quy trình xây dựng đề thi có ứng dụng lý thuyết khảo thí hiện đại vào quá trình xây
dựng đề. Từ đó có thể đánh giá ƣu nhƣợc điểm của các hình thức và cách thức ra đề.
Xem xét hai hình thức đo lƣờng đánh giá này có bổ xung, tồn tại cùng nhau hay loại
trừ nhau. Điều này làm cho các kì thi kiểm tra, đánh giá năng lực của học sinh trở nên
đơn giản và chính xác hơn.
2. Mục đích nghiên cứu
2
Nghiên cứu tập chung tìm hiểu cách xây dựng, thiết kế một đề thi môn toán lớp
12 và phân tích đánh giá đề thi theo lý thuyết đánh giá hiện đại (IRT).
3. Đối tƣợng và khách thể nghiên cứu
Đối tƣợng nghiên cứu: Cơ sở lý luận của việc kiểm tra đánh giá kết quả học tập
của học sinh ở nhà trƣờng phổ thông, phƣơng pháp soạn thảo, phân tích hệ thống câu
hỏi thi theo lý thuyết đánh giá hiện đại.
Khách thể nghiên cứu: Nội dung và các yêu cầu về kiến thức, kĩ năng môn toán
lớp 12. Học sinh đã hoàn thành chƣơng trình toán 12.
4. Câu hỏi nghiên cứu và giả thuyết nghiên cứu
Việc xây dựng đề thi nói chung và đề thi THPT quốc gia nói riêng cho đến nay
vẫn đang diễn ra chủ yếu dựa trên cơ sở của lý thuyết đánh giá cổ điển, phụ thuộc
nhiều vào các chuyên gia (cảm tính) ra đề. Mức độ khó dễ, phân biệt, giá trị, tin cậy
của câu hỏi trong các đề thi phụ cảm tính nhiều vào hội đồng ra đề thi (tuổi tác, giới
tính, vùng miền, trình độ,…) nên việc chỉnh sửa những câu hỏi thi không tốt trong các
đề thi thử nghiệm là rất khó khăn. Xây dựng ngân hàng câu hỏi một cách khách quan,
tin cậy, giá trị luôn đƣợc đặt lên hàng đầu trong mỗi kì thi. Mặc dù có nhiều khó khăn
khi tiếp cận IRT (các nghiên cứu về IRT chủ yếu là lí thuyết chƣa có nhiều triển khai
mang tính ứng dụng, các công thức tính toán nhiều, cần phần mềm chuyên dụng, …)
nhƣng lý thuyết IRT sẽ phần nào đáp ứng đƣợc việc xây dựng một ngân hàng câu hỏi,
ngân hàng đề theo sát các tiêu chí của một đề thi quốc gia trung học phổ thông. Do vậy
việc xây dựng ngân hàng câu hỏi thi theo định dạng câu hỏi nhị phân, đa phân, đa
chiều đang là bài toán đƣợc tập chung nghiên cứu nhiều gần đây không chỉ ở trên thế
giới mà ở Việt Nam cũng đang đƣợc quan tâm.
Câu hỏi nghiên cứu:
Câu hỏi 1: Việc xây đề thi môn toán lớp 12 ứng dụng theo lý thuyết đánh giá
hiện đại cần thực hiện nhƣ thế nào?
Câu hỏi 2: Phân tích các câu hỏi thi nhị phân, đa phân, đa chiều trong một đề thi
có giúp nâng cao chất lƣợng đề thi hay không?
3
Giả thuyết nghiên cứu: Dựa trên mục đích của kì thi, nguyên tắc viết câu hỏi
thi, ta có ma trận chi tiết của đề thi từ đó xây dựng đề thi. Thử nghiệm và xác định
tham số đặc trƣng của câu hỏi thi từ đó đánh giá chất lƣợng câu hỏi thi, tiến đến chuẩn
hóa đề thi.
4
5. Phƣơng pháp nghiên cứu
Nghiên cứu sử dụng cả phƣơng pháp định tính và định lƣợng trong việc thu
thập và xử lí thông tin. Nghiên cứu dự định tiến hành thông qua ba giai đoạn: Nghiên
của cơ sở lý thuyết, xây dựng mô hình nghiên cứu và các thử nghiệm. Các phƣơng
pháp nghiên cứu đƣợc sử dụng kết hợp phù hợp trong từng giai đoạn nghiên cứu.
Nghiên cơ sở lý thuyết: Cơ sở lý luận của kiểm tra đánh giá trong dạy học, lý
thuyết ứng đáp câu hỏi. Nghiên cứu những tài liệu về kĩ thuật viết câu hỏi thi. Nghiên
cứu về các phần mềm phân tích đánh giá kết quả thi đặc biệt là phần mềm Conquest.
Xây dựng mô hình nghiên cứu: Nghiên cứu cơ sở lý thuyết của lý thuyết khảo
thí hiện đại (IRT). Xây dựng ma trận đề thi và viết các câu hỏi thi. Dùng phần mềm
Conquest để phân tích các câu hỏi thi.Từ đó định chuẩn một đề thi mẫu và có các đánh
giá phân tích sơ bộ các tham số đặc trƣng: Độ khó, độ sai biệt, độ tin cậy.
Thực nghiệm: Thực nghiệm lấy mẫu, nhằm đánh giá đề kiểm tra trắc nghiệm
khách quan về độ tin cậy, độ giá trị và tính khả thi của nó. Phân tích đánh giá chất
lƣợng của đề thi.
6. Giới hạn và phạm vi nghiên cứu
Xây dựng và phân tích một đề thi môn toán lớp 12 và phân tích một đề thi môn
toán bằng phần mềm Conquest.
7. Cấu trúc của luận văn
Ngoài phần mở đầu, phần kết luận, khuyến nghị, luận văn gồm 3 phần sau:
Chƣơng 1: Cơ sở lý luận và tổng quan vấn đề nghiên cứu
Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi
Chƣơng 3: Kết quả nghiên cứu
5
CHƢƠNG 1
CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU
1.1. Tổng quan về đo lƣờng trong giáo dục
Cùng với xu hƣớng chung là đổi mới nội dung và phƣơng pháp giảng dạy trong
nhà trƣờng. Đo lƣờng, đánh giá trong giáo dục là một quá trình quan trọng, quyết định
sự thành bại của quá trình đổi mới đó. Đo lƣờng trong giáo dục là công cụ để xác định
năng lực nhận thức ngƣời học, điều chỉnh quá trình dạy học, điều chỉnh nội dung,
phƣơng tiện hỗ trợ quá trình dạy học nhằm đạt đƣợc đƣợc các mục tiêu, mục đích giáo
dục đề ra. Đổi mới phƣơng pháp, nội dung dạy học đƣợc chú trọng để đáp ứng những
yêu cầu mới của mục tiêu giáo dục. Do vậy việc kiểm tra, đánh giá phải phải theo sát
quá trình giảng dạy và mục tiêu giáo dục đề ra.
Hầu hết các đại lƣợng tâm lý là các thuộc tính của tƣ duy, mà tƣ duy thì không
thể quan sát trực tiếp (đại lƣợng ẩn), nhƣng vẫn có thể đo một cách gián tiếp thông qua
các hành vi có thể quan sát đƣợc của con ngƣời. Ví dụ: để biết một học sinh có nắm
đƣợc nội dung của môn học hay không sau khi học xong môn học đó, một bài kiểm tra
có thể cho chúng ta biết một cách chính xác: học sinh đó hiểu đến mức nào (chỉ nhận
biết khái niệm một cách máy móc hay còn có khả năng đánh giá, chuyển giao nhận
thức của mình). Các công cụ đo lƣờng, quan sát (ví dụ bài kiểm tra) cần đƣợc thiết kế
cẩn thận, có độ tin cậy cao để ghi nhận chính xác các hành vi, làm cơ sở để xác định
đại lƣợng ẩn. Đo lƣờng nói chung đòi hỏi độ chính xác và chính xác, vì kết quả đƣợc
hỗ trợ để có ý nghĩa đủ để cung cấp thông tin đáng tin cậy cho các hình thức ra quyết
định khác nhau.
1.1.1. Các khái niệm cơ bản về đo lường đánh giá
Đo lƣờng là quá trình mô tả mức độ cá nhân đạt đƣợc (hay đã có) một đặc điểm
nào đó (nhƣ khả năng, thái độ,…) đƣợc ƣớc lƣợng bằng những con số cụ thể. Ví dụ:
Học sinh X làm bài kiểm tra đạt điểm 8. Học sinh Y làm đƣợc 3/4 số điểm tối đa của
bài thi trắc nghiệm Toán. Bài của học sinh M đƣợc xếp hạng k trong lớp. Các điểm số
8, 3/4 hay thứ hạng k là những ký hiệu gián tiếp chỉ ra khả năng của học sinh về mặt
định tính hay định hạng [4, tr. 352 - 353]. Đo lƣờng thành quả học tập là lƣợng giá
6
mức độ đạt đƣợc các mục tiêu cuối cùng (terminal) hay tiêu chí (criterion) trong một
khóa học, một giai đoạn học.
Trắc nghiệm là một dụng cụ hay một phƣơng thức hệ thống nhằm đo lƣờng
thành tích của một cá nhân so với các cá nhân khác hay so với những yêu cầu, nhiệm
vụ học tập đã đƣợc dự kiến. Trong lĩnh vực giáo dục, thƣờng dùng chữ “trắc nghiệm
thành quả học tập” hay “trắc nghiệm thành tích”. Trong trƣờng học, từ “trắc nghiệm”
đƣợc dùng nhƣ là một hình thức kiểm tra, đánh giá học sinh. “Trắc nghiệm khách
quan”, không phải hiểu theo nghĩa đối lập với một đo lƣờng chủ quan nào, mà nên
hiểu là hình thức kiểm tra này có tính khách quan cao hơn cách kiểm tra, đánh giá
bằng luận đề (hình thức kiểm tra tự luận) chẳng hạn. Các điểm số thu thập đƣợc từ một
bài trắc nghiệm thành tích có thể cung cấp hai loại thông tin: (1) loại thứ nhất là mức
độ ngƣời học thực hiện đƣợc tiêu chí đã đƣợc ấn định, chẳng hạn nhƣ giải đƣợc đúng
một bài Toán thông kê mô tả, giải thích đúng các kết xuất (output) của một chƣơng
trình thống kê v.v., không cần biết ngƣời ấy làm giỏi hơn hay kém hơn những ngƣời
khác, (2) loại thứ hai là sự xếp hạng tƣơng đối của các cá nhân liên quan đến mức độ
thực hiện của họ về bài trắc nghiệm đã ra, chẳng hạn học viên A có thể giải các bài
toán nhanh hơn, hoặc giỏi hơn học viên B. – [4, tr. 364 - 366].
Kiểm tra là một hoạt động nhằm cung cấp những số liệu, những thông tin làm
cơ sở cho việc giám sát, đánh giá. Kiểm tra là một phần của quá trình dạy học và có
ảnh hƣởng đến cuộc đời của tất cả học sinh. Vì vậy giáo viên cần quan tâm đến những
yếu tố ảnh hƣởng đến việc kiểm tra nhƣ: đề thi phải rõ ràng, phù hợp với mục đích
kiểm tra, phải đọc và kiểm tra nhiều lần để không có những sai sót; phía học sinh
không bị mất tập trung chú ý trong suốt thời gian làm bài.
Lƣợng giá là đƣa ra những thông tin ƣớc lƣợng về trình độ, năng lực, phẩm
chất của một cá nhân, một sản phẩm, v.v, dựa trên các số đo cụ thể hoặc quan sát
đƣợc. Trong dạy học, dựa vào các điểm số một học sinh đạt đƣợc, ngƣời thầy giáo
(hay nhà quản lý giáo dục) có thể ƣớc lƣợng trình độ kiến thức, kỹ năng kỹ xảo của
học sinh đó. Ví dụ: học sinh A hoàn thành xong 2/3 bài thi toán đại số đƣợc lƣợng giá
là thuộc loại trung bình.
7
Đánh giá là quá trình thu thập, điều tra, phân tích và giải thích thông tin một
cách có chủ đích, hệ thống nhằm xác định mức độ đạt đến các mục tiêu đã đề ra. Nhƣ
vậy, số đo cung cấp cho ta số liệu dùng để đánh giá, còn việc suy đoán, diễn giải
những con số này biến chúng thành sự đánh giá. Ta có thể nói thêm về đánh giá nhƣ
sau: Đánh giá là một quá trình trong đó ta đƣa ra những giá trị hoặc ấn định những giá
trị cho một cái gì dó. Đặc điểm quan trọng của sự đánh giá đó là khả năng xét đoán.
Đánh giá thƣờng mang tính định lƣợng. Nó dựa trên những con số hoặc các tỉ lệ phần
trăm. Sự xét đoán khi đánh giá gắn với một giá trị (định lƣợng) hay sự mô tả định tính
căn cứ vào số đo trên một bài kiểm tra. Đánh giá là một quá trình gồm hai bƣớc. Bƣớc
thứ nhất đó là kiểm tra, trong đó số liệu thu thập từ việc sử dụng một hoặc một chuỗi
các bài kiểm tra. Khi việc kiểm tra đƣợc thực hiện thì sự xét đoán cũng đƣợc thực hiện
về trình độ, thƣờng là trong bối cảnh các mục đích có hƣớng dẫn.
Tin cậy: Độ tin cậy của một dụng cụ đo là khái niệm cho biết mức độ ổn định,
vững chãi của các kết quả đo đƣợc khi tiến hành đo vật thể đó nhiều lần. Thí dụ có một
gói mứt khi đặt lên cân, lần đầu báo 750 gam sang lần thứ hai báo 735 gam, lần thứ ba
báo 765 gam, v.v… Ta nói cái cân này tin cậy. Tƣơng tự một bài trắc nghiệm đƣợc gọi
là tin cậy khi một học sinh làm nhiều lần bài trắc nghiệm này vào những thời điểm
cách xa nhau thì các kết quả điểm số thu đƣợc đều khá ổn định (các điểm số của các
lần đo không chênh lệch qua nhiều). Độ tin cậy thƣờng đƣợc biểu hiện bằng một con
số trong khoảng từ 0 đến 1. Độ lớn càng gần với 1 thì dụng cụ càng tin cậy. Ví dụ:
nếu từ 0.80 trở lên thì độ tin cậy đƣợc gọi là cao từ 0.40 đến 0.79 thì tƣơng đối tin cậy,
dƣới 0.40 là tin cậy thấp.
Giá trị: Độ giá trị của một dụng cụ đo là một khái niệm chỉ ra rằng dụng cụ này
có khả năng đo đúng đƣợc cái cần đo. Thí dụ: Một vật có trọng lƣợng thực là 800 gam.
Nếu khi bỏ lên cân thấy báo trị số 800 gam, ta nói cái cân này giá trị. Còn thấy báo là
700 gam, cân sẽ không giá trị vì không đo đúng đƣợc trọng lƣợng cần đo. Đặt vật lên,
xuống đế cân nhiều lần, lần nào kết quả cũng không xê dịch khỏi 700 gam, ta nói cân
đó tin cậy nhƣng không giá trị.
1.1.2. Các phương pháp đo lường trong giáo dục
8
Hiện nay ở Việt Nam đã biết đến một hệ thống phƣơng pháp và kỹ thuật đánh
giá khá phong phú. Về phƣơng pháp đánh giá có thể kể ra: quan sát, vấn đáp, viết.
Trong viết còn bao gồm nhiều hình thức nhƣ: trắc nghiệm tự luận (tự luận), trắc
nghiệm khách quan hay còn gọi là trắc nghiệm.
Theo [3] và ý kiến của các chuyên gia về đo lƣờng đánh giá, ta nên sử hình thức
kiểm tra tự luận để khảo sát thành quả học tập trong những trƣờng hợp dƣới đây:
(1) Khi nhóm học sinh dự thi hay kiểm tra không quá đông và đề thi chỉ đƣợc
sử dụng một lần, không dùng lại nữa.
(2) Khi thầy cô giáo cố gắng tìm mọi cách có thể đƣợc để khuyến khích và khen
thƣởng sự phát triển kỹ năng diễn tả bằng văn viết.
(3) Khi thầy giáo muốn thăm dò thái độ hay tìm hiểu tƣ tƣởng của học sinh về
một vấn đề nào đó hơn là khảo sát thành quả học tập của chúng.
(4) Khi giáo viên tin tƣởng vào tài năng phê phán và chấm bài luận đề một cách
vô tƣ và chính xác hơn là khả năng soạn thảo những câu trắc nghiệm thật tốt.
(5) Khi thời gian soạn thảo bài khảo sát không nhiều .
Mặt khác, ta nên sử dụng trắc nghiệm khách quan trong những trƣờng hợp sau:
(1) Khi ta cần khảo sát kết quả học tập của một số lƣợng lớn học sinh, hay
muốn rằng bài khảo sát ấy có thể sử dụng lại vào một lúc khác.
(2) Khi ta những điểm số chính xác khách quan, công bằng và nhanh chóng.
(3) Khi ta cần kiểm tra toàn diện kiến thức, ngăn ngừa gian lận thi cử.
Cả trắc nghiệm lẫn tự luận đều có thể sử dụng để:
(1) Đo lƣờng mọi thành quả học tập mà học sinh thu nhận đƣợc ở các mức độ
nhận thức.
(2) Khảo sát đƣợc các khả năng hiểu, suy nghĩ có phê phán, giải quyết các vấn
đề mới, phân tích, tổng hợp.
(3) Khuyến khích, gợi động cơ học tập để nắm vững kiến thức.
1.1.3. Đánh giá kết quả học tập của học sinh
9
Với từng môn học thì các mục tiêu trên đƣợc cụ thể hóa thành các mục tiêu về
kiến thức, kỹ năng và thái độ. Mục đích của giáo dục là sự tiến bộ của học sinh. Đây
chính là kết quả cuối cùng của quá trình học tập nhằm thay đổi hành vi của học sinh.
Khi nhìn nhận mục tiêu giáo dục theo hƣớng kết quả học tập, cần phải lƣu tâm rằng
chúng ta đang đề cập đến những sản phẩm của quá trình học tập chứ không phải bản
thân quá trình đó. Mối liên hệ giữa mục tiêu giáo dục (sản phẩm) và kinh nghiệm học
tập (quá trình) đƣợc thiết kế nhằm hƣớng tới những thay đổi hành vi theo nhƣ mong
muốn. Vậy đánh giá kết quả học tập là quá trình phản hồi thông tin, chất lƣợng giảng
dạy tới ngƣời quản lý, ngƣời dạy và ngƣời học.
Khoa học đánh giá ngày càng phát triển, các loại hình đánh giá kết quả học tập
của học sinh đƣợc phân loại theo các quan điểm tiếp cận mà có các loại hình đánh giá
sau: đánh giá trên diện rộng và đánh giá trên lớp học, đánh giá chẩn đoán, đánh giá
ban đầu, đánh giá trong tiến trình và đánh giá tổng kết. Ngoài ra xét theo mục tiêu học
tập sẽ có hai loại đánh giá là Assessment for Learning (Đánh giá để cải tiến việc học
tập) và Assessment of Learning (Đánh giá kết thúc giai đoạn học tập). Mỗi loại đánh
giá sẽ có mục đích đánh giá, phƣơng pháp đánh giá, công cụ đánh giá và các khuyến
nghị khác nhau.
1.1.4. Công cụ đo lường kết quả học tập
Hoạt động đánh giá đào tạo đƣợc ra đời và phát triển song song cùng với hoạt
động đào tạo. Việc lƣợng hóa giá trị kết quả học tập nhờ sử dụng hình thức thi trắc
nghiệm (test) là một công đoạn quan trọng trong quá trình dạy học. Trắc nghiệm theo
nghĩa rộng là một hoạt động đƣợc thực hiện để đo lƣờng năng lực của các đối tƣợng
nào đó nhằm những mục đích xác định, chẳng hạn, phân loại thí sinh, tìm ra thí sinh
nổi trội, sàng lọc ra những thí sinh chƣa đạt chuẩn. Trong giáo dục trắc nghiệm đƣợc
tiến hành thƣờng xuyên ở các kỳ thi, kiểm tra hay sát hạch nhằm đánh giá kết quả học
tập và giảng dạy đối với một phần của môn học hoặc toàn bộ môn học hay đối với cả
một cấp học. Ngoài ra trắc nghiệm cũng có thể đƣợc sử dụng nhằm lọc chọn một số
ngƣời có năng lực cao nhất vào học một khoá học nào đó. Hiện nay trong giáo dục phổ
thông có hai hình thức chủ yếu đo lƣờng kết quả học tập của học sinh là câu hỏi trắc
nghiệm tự luận gọi tắt là câu hỏi tự luận và câu hỏi trắc khách quan (TNKQ). Ta xem
xét hai hình thức thi dƣới bảng so sánh sau: 10
11
Bảng 1.1 So sánh ưu nhược điểm của đề thi TNKQ và tự luận
Ƣu điểm Chỉ mục TNKQ Tự luận
Ít tốn công ra đề thi x
x Đánh giá đƣợc khả năng diễn đạt, đặc biệt là diễn đạt tƣ duy hình tƣợng
Đề thi phủ kín nội dung môn học x
Ít may rủi do “học tủ” x
Ít tốn công chấm thi x
Khách quan trong chấm thi x
x Áp dụng đƣợc công nghệ mới trong việc nâng cao chất lƣợng kỳ thi, giữ bí mật đề thi, hạn chế quay cóp khi thi, hạn chế tiêu cực trong chấm thi và giúp phân tích kết quả thi.
Nắm vững bản chất từng phƣơng pháp cùng điều kiện cơ sở vật chất và công
nghệ triển khai cụ thể, để sử dụng hợp lí, tối ƣu mỗi phƣơng pháp. Theo [3, tr. 29 – 36]
ta có bảng so sánh ƣu nhƣợc điểm của các hình thức thi TL và TN nhƣ sau.
Bảng 1.2 Hình thức thi TNKQ và tự luận
Vấn đề Đề thi TNKQ Đề thi tự luận
Hình thức câu hỏi / đề thi
Một bộ câu hỏi trong đó mỗi câu hỏi đều kèm theo các phƣơng án trả lời cho sẵn để học sinh lựa chọn phƣơng án trả lời. Một bộ câu hỏi trong đó mỗi câu hỏi không kèm theo các phƣơng án trả lời mà học sinh phải tự luận để đƣa ra câu trả lời.
Khó soạn câu hỏi. Dễ soạn câu hỏi
Ít bị sai sót về diễn đạt, nội dung rõ ràng. Dễ sai về diễn đạt, nội dung câu hỏi thiếu chính xác (vì có nhiều câu hỏi nên khó rà soát).
Mức độ phức tạp khi viết câu hỏi và tổ hợp đề
Dễ chuẩn bị đáp án, hƣớng dẫn chấm. Khó xây dựng đáp án, hƣớng dẫn chấm, xây dựng đáp án phức tạp.
12
Có nhiều câu hỏi nên khó nhớ, dễ bảo mật. Khó bảo mật đề thi do có ít câu hỏi.
Tốn ít thời gian làm bài, đề kiểm tra có thể phủ toàn bộ chƣơng trình. Phải dành nhiều thời gian cho học sinh làm bài, khó kiểm tra toàn bộ chƣơng trình.
Tốn nhiều thời gian cho việc in ấn, nhân đề. Không tốn nhiều công sức in ấn đề. Mức độ phức tạp khi tổ chức thikiểm tra
Học sinh khó sử dụng tài liệu, loại trừ tiêu cực trong thi cử. Học sinh dễ quay cóp sử dụng tài liệu, tiêu cực trong thi cử.
Học sinh có thể đoán mò. Học sinh không đoán đƣợc câu trả lời đúng. Vấn đề đoán mò phƣơng án trả lời đúng
Độ tin cậy cao. Độ tin cậy thấp. Độ tin cậy của đề thi
Có thể đánh giá đầy đủ các mức nhận thức nếu các câu hỏi đƣợc soạn kỹ. Dễ đánh giá đƣợc các mức nhận thức cao (phân tích, tổng hợp, đánh giá).
Tính giá trị của đề thi
Bao quát toàn bộ chƣơng trình nên đánh giá chính xác hơn, có thể có độ giá trị cao hơn. Không bao quát toàn bộ chƣơng trình nên độ giá trị có thể không cao.
Chấm điểm khách quan, công bằng Chấm điểm phụ thuộc vào ý chủ quan của ngƣời chấm. Sự phức tạp của việc chấm điểm
Khó phân tích, đánh giá câu hỏi.
Mức độ phức tạp khi phân tích, đánh giá câu hỏi thi Có nhiều phần mềm để phân tích, đánh giá câu hỏi, lựa chọn những câu hỏi có chất lƣợng.
13
1.1.5. Sơ lược về khoa học đo lường đánh giá trên thế giới và Việt Nam.
1.1.5.1. Sơ lược về khoa học đo lường đánh giá trên thế giới
Lý thuyết trắc nghiệm đã đƣợc xây dựng và đƣa vào ứng dụng trong các trƣờng
đại học ở Mỹ và một số nƣớc khác từ khá sớm (bắt đầu từ những năm 1920). Lý thuyết
trắc nghiệm là cơ sở khoa học giúp đánh giá chất lƣợng của bài thi trắc nghiệm (thông
qua đánh giá các câu hỏi) và ƣớc lƣợng năng lực thí sinh (thông qua việc thí sinh trả
lời các câu hỏi). Lĩnh vực khoa học đo lƣờng phát triển mạnh ở Mĩ vào thời kỳ từ
trƣớc và sau thế chiến thứ hai với những dấu mốc quan trọng nhƣ trắc nghiệm trí tuệ
Stanford-Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập tổng hợp đầu
tiên Stanford Achievement Test ra đời vào năm 1923. Cho đến nay có hai hệ lý luận
chính dùng trong lý thuyết đo lƣờng giáo dục, đó là: lý thuyết trắc nghiệm cổ điển
(Classical Test Theory - CTT); lý thuyết ứng đáp câu hỏi (Item Response Theory -
IRT). IRT ra đời sau CTT và hiện nay trên thế giới IRT đƣợc áp dụng rộng rãi trong
các hệ thống đánh giá giáo dục, đặc biệt là ở Mỹ, Australia và một số nƣớc phát triển
khác.
Hai cách tiếp cận thống kê về lý thuyết đo lƣờng, thƣờng đƣợc gắn nhãn nhƣ là
"cổ điển" và "hiện đại" (lý thuyết ứng đáp câu hỏi) (Gustaffson 1977, Crocker và
Algina 1986). Mặc dù chúng tƣơng đối khác nhau, nhƣng không nên xem chúng nhƣ
các đối thủ bởi chúng bổ sung các ƣu nhƣợc điểm cho nhau. Có lẽ vấn đề khác biệt có
thể đƣợc hiểu là sự phụ thuộc vào mẫu và so bằng của bài kiểm tra cổ điển. Điểm số
đƣợc tính trên cơ sở các thủ tục phân tích cổ điển cung cấp thông tin về khả năng của
thí sinh chỉ ở một mức độ hạn chế. Ngoài ra, vì kiểm tra các đặc tính của thí sinh đƣợc
xác định trên cơ sở hồi đáp của một tập hợp học sinh, chỉ có thể đƣợc tái sử dụng với
cùng một tập học sinh đó hoặc với một tập học sinh mới có những đặc điểm tƣơng
đồng với tập học sinh đã cho - một trở ngại lớn trong cách hiệu quả xây dựng ngân
hàng câu hỏi.
Bên cạnh về sự nghiên cứu và phát triển của lý thuyết khảo thí cổ điển (CTT)
những năm đầu thế kỉ 20 ở châu Âu và Mỹ, từ thập niên 50 những công trình đầu tiên
về lý thuyết khảo thí hiện đại (IRT) đã đƣợc công bố. Allen Birnbaum đã viết một loạt
các báo cáo kỹ thuật về các mô hình và mô hình kiểm tra đánh giá tham số vào năm
14
1957 và 1958. George Rasch (1960) xuất bản cuốn sách của ông đề xuất một số mô
hình cho ứng đáp câu hỏi. Trong những năm 1960, nhiều công việc trong lĩnh vực này
đã đƣợc đóng góp bởi Baker (1961) về so sánh thực nghiệm giữa các tiêu chí của bài
thi. Có thể kể ra và Novick (1968), và Wright (1968) đã làm việc trên các mô hình nhị
phân. Samejima đề xuất mô hình đa phân trong năm 1969. Nhóm học giả này đã mang
lại các kết quả đáng kể trong lĩnh vực này. Thông qua những năm 1970 và 1980, một
nhóm học giả mới nổi lên bao gồm Aldrich (1978), Anderson (1977, 1980),
Hambleton và Swaminathan (1986), Wright and Stone (1979), Swaminathan và
Rogers (1981), và Harris (1989). Cũng có những đóng góp quan trọng cho lý thuyết
khảo thí hiện đại. [B4]. Vào những năm 2000, lĩnh vực IRT đã đƣợc thúc đẩy bởi một
làn sóng các nhà nghiên cứu mới, những ngƣời không chỉ mở rộng các khía cạnh lý
thuyết (dự toán, xác định mô hình, và sự phù hợp), mà còn nâng cao các khía cạnh tính
toán và ứng dụng của nó. Nghiên cứu sâu rộng về IRT trong 50 năm qua năm đã đƣợc
thể hiện bằng sự gia tăng số lƣợng các gói phần mềm đƣợc thiết kế để phân tích câu
hỏi dữ liệu phản hồi từ các khảo sát hoặc kiểm tra. Nhiều phần mềm thƣơng mại khác
của IRT cũng đƣợc tạo ra nhƣ BILOG, MULTILOG, WINSTEPS, IRTPRO, MPLUS,
QUEST, CONQUEST và HLM, là các ví dụ. Quan trọng hơn nữa là một số gói IRT đã
đƣợc phát triển trong phần mềm mã nguồn mở R để ƣớc tính các mô hình IRT khác
nhau cũng xuất hiện và đã đƣợc công nhận. Bao gồm các gói ltm cho IRT không giới
hạn ((Rizopoulos, 2006), eRm cho các mô hình Rasch mở rộng (Mair & Hatzinger,
2007), mlirt cho đánh giá đa cấp và Bayesian của một số mô hình IRT (Fox, 2007),
gpcm (Johnson, 2007) cho một dự toán Bayesian của mô hình tín dụng một phần tổng
quát, MCMCpack cho Bayesian IRT (Martin, Quinn, & Park, 2011), và mirt cho IRT
đa chiều (Chalmers, 2012). De Boeck (2008) và Wilson (2008) đã sử dụng gói thống
kê chung lme4 và kết hợp các mô hình Rasch theo mô hình hỗn hợp tuyến tính tổng
quát. Điều này làm cho có thể sử dụng SAS PROC NLMIXED (SAS Institute Inc.)
cho IRT.
Bƣớc ngoặt cho sự phát triển nở rộ là ý tƣởng thay mô hình dạng vòm chuẩn mà
Birnbaum và Lord đề xuất cho hàm đặc trƣng câu hỏi bằng mô hình logistic mà
George Rasch đề xuất. Từ đây các khó khăn về mô hình toán học trong IRT đƣợc tháo
gỡ. Trên cơ sở IRT công nghệ trắc nghiệm thích ứng nhờ máy tính (Computer
15
Adaptive Test – CAT) ra đời. Ngoài ra, trên cơ sở những thành tựu của IRT, công
nghệ E-RATE chấm tự động các bài tự luận tiếng Anh nhờ máy tính của ETS đã đƣợc
triển khai nhờ mạng Internet trong nhiều năm qua. Hiện nay một số nƣớc Nhật, Thái
Lan, Trung Quốc ... bƣớc đầu áp dụng lý thuyết IRT vào các kì thi diện rông của mình.
16
1.1.5.2. Ứng dụng trắc nghiệm ở Việt Nam
Khoa học về đo lƣờng và đánh giá trong giáo dục ở nƣớc ta thực sự chƣa đƣợc
quan tâm đúng mức. Trƣớc đây do chiến tranh, nên các chuyên gia về đo lƣờng đánh
giá ở miền Bắc gần nhƣ không có. Trƣớc năm 1975, ở Miền Nam nƣớc ta có một vài
ngƣời đƣợc đào tạo bài bản về đo lƣờng đánh giá nhƣ GS. Dƣơng Thiệu Tống. Những
năm 90 bộ giáo dục đã bƣớc đầu có định hƣớng gửi đi đào tạo các nƣớc phát triển các
chuyên gia về đo lƣờng đánh giá, nhƣng số lƣợng còn quá ít. Hiện nay ngay trong một
số trƣờng sƣ phạm môn đo lƣờng đánh giá vẫn chƣa đƣợc giảng dạy nhƣ một môn học
chính khóa. Các sách viết về khoa học đo lƣờng cho đến nay chủ yếu của hai giáo sƣ
GS. Dƣơng Thiệu Tống và GS. Lâm Quang Thiệp. Các cuốn sách này tƣơng đối hàn
lâm với đa số ngƣời đọc và giáo viên. Tuy nhiên những năm gần đây các hội thảo,
khóa học ngắn về đo lƣờng đánh giá đã đƣợc các trƣờng đại học, bộ giáo dục tổ chức
thƣờng xuyên nhằm từng bƣớc “xóa mù”, phổ cập cho giáo viên và các nhà quản lý
giáo dục. Các kì thi trung học phổ thông quốc gia chuyển dần sang hình thức thi trắc
nghiệm và ứng dụng khoa học khảo thí vào công việc thiết kế, xây dựng, phân tích đề
thi. Đây là một vấn đề khoa học tƣơng đối mới nên đôi ngũ nghiên cứu, đào tạo làm
chuyên môn về khỏa thí hiện đại chƣa nhiều chủ yếu các nhóm nghiên cứu nằm trong
trƣờng hoặc liên quan đến ĐHQG HN.
17
1.2. Lý thuyết đánh giá cổ điển
Mặc dù IRT đã đƣợc nghiên cứu trong 50 năm qua, CTT vẫn đƣợc nghiên cứu
và áp dụng liên tục. Nhiều chƣơng trình thử nghiệm vẫn còn thực hiện CTT trong thiết
kế và đánh giá kết quả kiểm tra. Điều này là do một số lợi thế CTT so với IRT. Ví dụ,
CTT mô tả mối quan hệ giữa điểm số thực và điểm quan sát theo một cách tuyến tính
làm cho mô hình CTT dễ hiểu và áp dụng nhiều nhà nghiên cứu. Nó dựa hoàn toàn vào
tổng số điểm hoặc điểm số của chính các câu trả lời. Điểm quan sát của thí sinh là tổng
số điểm đạt đƣợc của mỗi thí sinh và nó khác với điểm số thực sự của một điểm số lỗi
thông thƣờng. Phƣơng pháp tính điểm này đã tạo ra một số lợi thế cũng nhƣ hạn chế.
Lợi thế đầu tiên của CTT là các phân tích yêu cầu kích cỡ mẫu nhỏ hơn IRT. Thứ hai,
CTT thủ tục toán học đơn giản hơn nhiều so với IRT, vì các mô hình trong CTT là
tuyến tính trong khi các mô hình của IRT là phi tuyến. Thứ ba, mô hình tham số ƣớc
tính trong CTT là khái niệm đơn giản và đòi hỏi tối thiểu giả định, làm cho các mô
hình hữu ích và áp dụng rộng rãi. Thứ tƣ, các phân tích không yêu cầu sự nghiêm
chỉnh của các nghiên cứu phù hợp nhƣ trong IRT. Tuy nhiên, CTT có một vài nhƣợc
điểm lớn. Nền tảng của nhiều phân tích CTT là các đặc tính của các bài kiểm tra khó
khăn và độ tin cậy. Các chỉ số này đƣợc đo bằng tỷ lệ của phần %, p, của ngƣời kiểm
tra, ngƣời mà trả lời câu hỏi một cách chính xác và tổng số câu hỏi tƣơng quan, r: Tuy
nhiên, các chỉ số không liên tục vì chúng hoàn toàn phụ thuộc vào mẫu của thí sinh
đƣợc lấy. Không thể sử dụng chúng để chỉ ra đặc trƣng hoặc chất lƣợng của một bài
kiểm tra. Một nhƣợc điểm nữa đó là điểm thi của thí sinh đƣợc kiểm chứng. Nghĩa là,
thí sinh có thể đạt đƣợc điểm cao hơn trên một bài kiểm tra dễ dàng hơn và điểm thấp
hơn trên một khó kiểm tra, và do đó không có điểm số thực sự có thể đƣợc trích xuất.
Điều này không cho phép một cơ sở để kết hợp bài kiểm tra và mức độ khả năng. Theo
nghĩa này, IRT có nhiều lợi ích hơn CTT. Trong khung IRT, các đặc điểm của mục là
độc lập mẫu và điểm tiềm ẩn của một cá nhân đƣợc kiểm tra độc lập với điều kiện là
các mô hình đƣợc lựa chọn phù hợp với dữ liệu. Vì vậy, điểm số mô tả trình độ thí
sinh không phụ thuộc vào số lƣợng cũng nhƣ năng lực của mẫu thử nghiệm. Điểm số
của họ có thể thấp hơn khi các bài kiểm tra khó hơn và cao hơn các bài kiểm tra dễ
dàng hơn nhƣng điểm số về khả năng của chúng vẫn không đổi so với bất kỳ bài kiểm
tra nào tại thời điểm thử nghiệm hoặc khảo sát. IRT cũng cho phép tính toán xác suất
18
của một ngƣời trả lời cụ thể chọn một trên một câu hỏi kiểm tra. Các bài kiểm tra mẫu
độc lập tạo điều kiện thuận lợi cho việc thiết kế bài kiểm tra thích nghi trên máy tính,
cho phép so sánh chính xác hơn hoặc xác định rõ năng lực ngƣời kiểm tra. Hơn nữa,
IRT có thể đƣợc sử dụng để sàng lọc quy mô lớn hoặc rời rạc, vì nó có khả năng tính
toán tiêu chuẩn lỗi và do đó cung cấp thông tin về chất lƣợng của mỗi câu hỏi thi. Hỗ
trợ này với việc làm quyết định lựa chọn các câu hỏi để loại trừ hoặc đƣa vào một câu
hỏi kiểm tra trong bài thi. Ngoài ra, các câu hỏi cũng đƣợc lựa chọn dựa trên các chỉ số
độ khó, độ phân biệt của câu hỏi, nghĩa là khả năng của họ phân biệt các nhóm có đặc
điểm tiềm ẩn thấp và cao. Mặc dù có những ƣu điểm, các mô hình IRT cũng có những
thiếu sót hạn chế của nó. Về mặt kỹ thuật, các mô hình thƣờng quá phức tạp hơn và
các phƣơng pháp ƣớc lƣợng tham số thƣờng liên quan đến phƣơng pháp số, các công
thức toán học. Các đặc điểm tiềm ẩn cũng nhƣ các thông số của câu hỏi thi cũng có thể
khó giải thích cả bằng đồ họa và số. Do vậy mà mô hình CTT vẫn đƣợc nghiên và
dùng phổ biến hiện nay. Để nắm chắc về lý thuyết khảo thí cổ điển chúng ta cần biết rõ
về các khái niệm thống kê, các đặc trƣng của câu hỏi trắc nghiệm,…
1.2.1. Các tham số đặc trưng của cầu hỏi trắc nghiệm và phân tích đề trắc nghiệm
1.2.1.1. Công thức tính độ khó của câu trắc nghiệm.
Đề thi đƣợc cho là dễ khi tỉ lệ học sinh làm đúng trên tổng số thí sinh dự thi là
một số gần bằng 1, ngƣợc lại, khi tỉ lệ này gần bằng 0. Từ ý tƣởng đó, ngƣời ta đi đến
công thức tính độ khó của câu trắc nghiệm nhƣ sau:
Số ngƣời trả lời đúng câu i
Độ khó của câu i =
Tổng sổ ngƣời làm bài trắc nghiệm
Khi nào độ khó của câu trắc nghiệm (TN) bằng 0? Khi nào độ khó của câu TN
bằng 1? Nhƣ vậy độ khó của câu TN có thể có những giá trị từ bao nhiêu đến bao
nhiêu? Độ khó càng gần 0 thì câu TN càng khó. Độ khó càng gần 1 thì câu TN càng
dễ. Thực ra độ khó ở đây đƣợc hiểu là năng lực thực hiện câu hỏi của TS.
1.2.1.2. Xác định độ khó vừa phải của câu trắc nghiệm
19
Để có thể kết luận đƣợc rằng một câu TN là dễ, khó hay vừa sức học sinh (HS),
trƣớc hết ta phải tính độ khó của câu TN ấy rồi so sánh với độ khó vừa phải (ĐKVP)
của loại câu TN ấy.
- Nếu độ khó của câu TN > ĐKVP thì ta kết luận rằng câu TN ây là dễ so với
trình độ HS lớp làm trắc nghiệm.
- Nếu độ khó của câu TN < ĐKVP, thì ta kết luận rằng câu TN ấy là khó so với
trình độ HS của lớp làm trắc nghiệm.
- Nếu độ khó của câu TN xấp xỉ với ĐKVP, thì ta kết luận rằng câu TN vừa sức
với trình độ HS của lớp làm trắc nghiệm.
Ta có thể biểu diễn điều ấy trên một trục hoành nhƣ sau:
ĐKVP
Câu TN khó Câu TN vừa Câu TN dễ
Nhƣng làm cách nào để tính đƣợc ĐKVP của câu TN?
Công thức tính ĐKVP:
100% + % may rủi
Độ khó vừa phải câu i =
2
Mỗi loại câu TN có tỉ lệ % may rủi khác nhau. Loại câu đúng- sai có tỉ lệ %
may rủi là 50%, loại câu có 4 lựa chọn có tỉ lệ % may rủi là 25%, loại câu có 5 lựa
chọn có tỉ lệ % may rủi là 20%. Từ đó bạn hãy tính độ khó vừa phải của từng loại câu
TN và nếu bạn có đƣợc độ khó của một câu TN, thì bạn có thể kết luận đƣợc rằng câu
TN ấy là khó hay dễ so với trình độ HS lớp làm trắc nghiệm.
1.2.1.3. Độ phân biệt của câu hỏi
Độ phân biệt của một câu TN là một chỉ số giúp ta phân biệt đƣợc HS giỏi với
HS kém. Cho nên, một bài TN gồm toàn những câu TN có độ phân cách tốt trở lên sẽ
là một công cụ đo lƣờng có tính tin cậy cao. Nhƣng làm cách nào để tính đƣợc độ phân
20
cách của câu TN? Sau khi đã chấm và cộng tổng điểm của từng bài TN, ta có thể thực
hiện các bước sau để biết được độ phân cách của một câu TN:
Bước 1: Xếp đặt các bài làm của học sinh (đã chấm, cộng điểm) theo thứ tự
tổng điểm từ cao đến thấp.
Bước 2: Căn cứ trên tổng số bài TN, lấy 27% của tổng số bài làm có điểm từ bài
cao nhất trở xuống xếp vào nhóm CAO và 27% tổng số bài làm có điểm từ bài thấp
nhất trở lên xếp vào nhóm THẤP.
Bước 3: Tính tỉ lệ phần trăm học sinh làm đúng câu TN riêng cho từng nhóm
(CAO, THẤP) bằng cách đếm số ngƣời làm đúng trong mỗi nhóm và chia cho số
ngƣời của nhóm (lƣu ý: số ngƣời mỗi nhóm = 27% tổng số bài làm học sinh).
Bước 4: Tính độ phân cách câu (D) theo công thức: D = Tỉ lệ % nhóm cao làm
đúng câu TN - Tỉ lệ % nhóm thấp làm đúng câu TN
Lặp lại các bƣớc 3 và 4 cho mỗi câu trắc nghiệm khác.
Chú thích: Có thể tính độ phân cách của một câu trắc nghiệm theo cách tƣơng
đƣơng: Thực hiện bƣớc 1 và 2 nhƣ mô tả trên. Trong bƣớc 3 đếm số ngƣời làm đúng
trong mỗi nhóm, gọi là Đúng (CAO) và Đúng (THẤP). Sau đó thay vào công thức
(bƣớc 4):
Đúng (Cao) - Đúng (Thấp)
Độ phân cách câu i = x 100%
Sỗ ngƣời trong 1 nhom
Theo công thức tính độ phân cách ở phần 2, độ phân cách của một câu TN nằm
trong giới hạn từ -1.00 đến +1.00. Để có thể đƣa ra kết luận sau khi tính đƣợc độ phân
cách của một câu TN, ta căn cứ vào quy định sau:
* D ≥ 0.40. Câu TN có độ phân cách rất tốt.
*0.30 ≤ D ≤0.39. Câu TN có độ phân cách khá tốt nhƣng có thể làm cho tốt hơn.
*0.20 ≤ D ≤0.29. Câu TN có độ phân cách tạm đƣợc, cần phải điều chỉnh.
* D ≤0.19. Câu TN có độ phân cách kém cần phải loại bỏ hay phải sửa chữa nhiều.
1.2.1.4. Phân tích đề thi
21
a) Phân tích đáp án: Đáp án là lựa chọn đƣợc xác định là ĐÚNG NHẤT trong số các
lựa chọn của phần trả lời câu MCQ (hoặc là giá trị ĐÚNG của mệnh đề trong câu
Đúng - Sai). Một câu hỏi tốt nếu số ngƣời trả lời đúng ở nhóm cao hơn số ngƣời trả lời
đúng ở nhóm thấp. Một câu hỏi có độ phân biệt tốt là tỉ lệ % số ngƣời ở nhóm cao
chọn đáp án phải nhiều hơn số ngƣời ở nhóm thấp chọn đáp án từ 40% trở lên.
b) Phân tích mồi nhử: Khác với đáp án, mồi nhử là những lựa chọn đƣợc xác định là
SAI trong phần trả lời. Chúng đƣợc tập hợp từ những câu trả lời sai trong bài làm của
nhiều HS khi làm những câu hỏi dạng luận đề giáo viên đặt.
Vì vậy, một mồi nhử đƣợc gọi là tốt khi HS thuộc nhóm CAO ít chọn nó, còn
HS thuộc nhóm THẤP chọn nó nhiều hơn, nghĩa là sự chênh lệch số ngƣời chọn (hoặc
tỉ lệ%) của hai nhóm là lớn. Để làm rõ hơn ý vừa nói, ta hãy phân tích đáp án và mồi
nhử của câu 1.
Bảng 1.3 Mô tả câu nhóm các câu hỏi trắc nghiệm
Câu 1 A B* C D Không trả lời TC
Nhóm cao 0 10 1 0 0 11
Nhóm thấp 1 7 2 1 0 11
Ghi chú: B* là đáp án.
Nhân xét các lựa chọn câu 1: Quan sát các mồi nhử A, C, D ta thấy số ngƣời ở
nhóm thấp chọn nhiều hơn số ngƣời ở nhóm cao nhƣng mức độ chênh lệch không
nhiều, cho nên ta có thể nhận định đầy là những mồi nhử chƣa tốt lắm. Thêm vào đó, tỉ
lệ % số ngƣời ở nhóm cao chọn đáp án B hơn tỉ lệ % số ngƣời ở nhóm thấp chọn đáp
án B chỉ có 27% nên độ phân cách của câu này không cao. Ta hãy xem lại nội dung cụ
thể của câu trắc nghiệm số 1 này (đáp án = B):
1.2.1.5. Một số tiêu chuẩn để chọn câu trắc nghiệm
Khi chọn câu TN đƣợc chọn (lƣu vào ngân hàng đề) ta cần chú ý:
(1). Những câu TN có độ khó quá thấp hay quá cao, đồng thời có độ phân cách
âm hoặc quá thấp là những câu kém cần phải xem lại để loại đi hay sửa chữa lại.
22
(2). Với đáp án trong câu TN, số ngƣời nhóm cao chọn phải nhiều hơn số ngƣời
nhóm thấp.
(3). Với các mồi nhử, số ngƣời trong nhóm cao chọn phải ít hơn số ngƣời trong
nhóm thấp.
Dựa và các tiêu chí trên chúng ta hoàn toàn có thể xây dựng đƣợc các đề trắc
nghiệm chất lƣợng. Tuy nhiên nhƣ đã phân tích ở phần trƣớc. Với các mẫu thay đổi,
thì các tham số đặc trƣng của câu hỏi (độ khó, độ phân biệt,..) cũng thay đổi theo. Nên
trong lý thuyết CTT vẫn đề chọn mẫu là rất quan trọng.
1.2.2. Điểm số học tập
1.2.2.1. Điểm thô (raw scores)
Điểm số trên một bài thi (bài tự luận, bài trắc nghiệm lớp học hay bài trắc
nghiệm đƣợc tiêu chuẩn hóa) thƣờng đƣợc xác định bởi điểm của mỗi câu. Bài tự luận,
điểm số một câu hỏi có thể lớn hơn 1, trong đó một số ý đặc trƣng trong câu trả lời
đƣợc cho điểm theo một thang điểm đã định trƣớc. Với bài trắc nghiệm, mỗi câu hỏi
chỉ có thể quy về đúng hay sai. Câu trả lời đúng thƣờng đƣợc tính là 1 điểm. Tổng
cộng các điểm số từng câu trắc nghiệm đƣợc gọi là điểm thô. Ta thấy điểm thô của bài
trắc nghiệm không giúp ta so sánh giữa các bài trắc nghiệm có độ khó khác nhau. Vì
vậy thƣờng phải đổi điểm thô thành các loại điểm khác phù hợp với việc nghiên cứu,
trình bày và giải thích. Hiện nay ở nƣớc ta áp dụng điểm từ 0 đến 10.
1.2.2.2. Điểm phần trăm đúng
Điểm số này tính bằng tỉ lệ phần trăm, theo công thức: X = 100 Đ/T. Trong đó:
X = điểm tính theo tỉ lệ %;
Đ = số câu học sinh làm đúng;
T = tổng số câu của bài trắc nghiệm.
Điểm phần trăm đúng so sánh điểm của học sinh này với điểm số tôi đa có thể
đạt đƣợc. Đây là một loại điểm tuyệt đối. Yếu tố xác định điểm số này là độ khó của
nội dung bài trắc nghiệm, cần thận trọng khi sử dụng nó, vì dễ bị chủ quan của ngƣời
ra đề và thƣờng không đo lƣờng đƣợc mức khả năng thực của học sinh. Bởi vì ngƣời
ra đề thi có thể thay đổi số câu trắc nghiệm dễ hay khó tùy theo ý muốn.
23
1.2.2.3. Điểm chữ
Về căn bản cũng giống nhƣ điểm phần trăm đúng, điểm chữ dùng các mẫu tự A,
B, C, D, v.v… và có thể ấn định: điểm A gồm các điểm phần trăm đúng từ 90 đến 100,
điểm B gồm các điểm phần trăm đúng từ 70 đến 89, điểm C gồm các điểm phần trăm
đúng từ 50 đến 69, v.v….
24
1.2.2.4. Thứ hạng bách phân (Percentile Ranks, thường viết là PR)
Đây là điểm có đƣợc do sự biến đổi các điểm thô ra thành các trị số phần trăm
trong một nhóm chọn làm chuẩn mực.
a) Định nghĩa: Thứ hạng bách phân là một con số nằm giữa 0 và 100, cho biết có bao
nhiêu phần trăm trƣờng hợp điểm số trong nhóm chuẩn mực rơi vào chính điểm số ấy
hay ở dƣới nó.
b) Ý nghĩa: Dùng điểm PR có thể so sánh điểm của các học sinh làm bài trắc nghiệm
này với một nhóm lớn đã đƣợc chọn làm chuẩn mực.
1.2.2.5. Điểm tiêu chuẩn (Standard scores)
a) Mô tả: Điểm tiêu chuẩn là điểm biến đổi từ điểm thô dựa trên cơ sở độ lệch tiêu
chuẩn của phân bố điểm số. Chúng có thể đƣợc xem nhƣ là những điểm số đã đƣợc
gán cho một trung bình và một độ lệch tiêu chuân nào đó. Nó thƣờng đƣợc sử dụng
trong trắc nghiệm vì một số đặc tính sau:
- Mỗi loại điểm tiêu chuẩn có trung bình và độ lệch tiêu chuẩn chung cho mọi
bài trắc nghiệm và mọi nhóm ngƣời.
- Điểm tiêu chuẩn cho phép ta thực hiện so sánh các trắc nghiệm hoặc giữa các
nhóm ngƣời.
- Có thể xử lý bằng mọi phƣơng pháp toán học.
b) Các loại điểm tiêu chuẩn thông dụng: điểm Z, điểm V. Ở nƣớc ngoài còn có
điểm Stanine (9 bậc), điểm C-Guilford, điểm T, Điểm AGCT, điểm CEEB. Về trắc
nghiệm trí tuệ ngƣời ta dùng thƣơng số trí tuệ IQ (với các trắc nghiệm Vechsler,
Stanford - Binet, v.v…).
c) Ƣu, nhƣợc điểm của các loại điểm tiêu chuẩn: Điểm tiêu chuẩn có ƣu điểm hơn
điểm % đúng, thứ hạng bách phân vị nó có thể dùng tính toán hoặc đối chiếu các kết
quả. Nhƣ: cộng các điểm tiêu chuẩn của nhiều bài trắc nghiệm môn học khác nhau để
tính trung bình (ta vẫn hay làm trong điểm bài luận đề lâu nay); so sánh hai hay nhiều
điểm trung bình của 1 bài trắc nghiệm ra trên nhiều nhóm, đối chiếu điểm trên các bài
trắc nghiệm khác nhau; tính hệ số tƣơng quan (với một bài trắc nghiệm đã chuẩn hóa)
25
để xác định tính giám của bài trắc nghiệm mới soạn. Nhƣợc điểm của điểm tiêu chuẩn
là:
+ Nếu các dữ kiện có độ xiên quá lớn thì việc sử dụng điểm tiêu chuẩn là không
thích hợp vì là một loại điểm tƣơng đối, nếu bài quá dễ hay quá khó đối với nhóm học
sinh thì điểm trung bình bị lệch nhiều so với vùng trung tâm. Các điểm số không còn
phản ánh đúng thực chất khả năng lĩnh hội bài học của học sinh.
+ Vì điểm tiêu chuẩn phụ thuộc vào độ lệch tiêu chuẩn nên khó giải thích ý
nghĩa của các điểm số trắc nghiệm. Học sinh đạt 7 môn Anh văn có thể là giỏi trong
lớp, trong khi điểm 7 môn Toán chỉ là khá trong lớp đó.
1.2.2.6. Công thức đổi điểm thô sang một số điểm tiêu chuẩn
a) . Điểm Z (Z score): Điểm Z liên hệ đến phân bố bình thƣờng tiêu chuẩn với trung
bình = 0 và độ lệch tiêu chuẩn = 1.
Công thức chuyển đổi: Z = (X – điểm trung bình X) / s
Trong đó X là một điểm thô; X = điểm thô trung bình của nhóm làm trắc
nghiệm; s = độ lệch tiêu chuẩn của nhóm.
Điểm Z cho biết vị trí của một học sinh có điểm thô X so với trung bình của
nhóm học sinh cùng làm bài trắc nghiệm..
Bảng Z và công dụng: Đây là bảng cho các trị số là diện tích tính theo tỉ lệ %.
Diện tích này chính là tích phân (tích phân Laplace) giới hạn bởi đƣờng cong bình
thƣờng tiêu chuẩn (đƣờng Gauss, N(0,1)) với trục hoành tính từ giá trị Z = 0 (tức ngay
tại trị trung bình) đến giá trị Z > 0 xác định nào đó (xin xem bảng Z đính kèm cuối
chƣơng này). Do tính đối xứng của đƣờng cong qua trục tung (Z=0) nên tổng diện tích
trong bảng (từ trung bình trở lên) sẽ là 50%.
Công dụng: trị số đọc trong bảng cho ta tính ƣớc lƣợng tỉ lệ % học sinh ở phía
dƣới hay phía trên một học sinh đạt điểm số Z nào đó.
b) Điểm tiêu chuẩn V: Căn bản giống nhƣ điểm Z, nhƣng đƣợc quy về phân bố bình
thƣờng có trung bình = 10 và độ lệch tiêu chuẩn là 4. Loại điểm này đƣợc áp dụng tại
Việt Nam trƣớc 1975, với hệ thống điểm cho từ 0 -> 20. Để có điểm V, trƣớc hết đổi
điểm thô X ra Z, sau đó áp dụng công thức và làm tròn số để nhận đƣợc giá trị nguyên:
26
Điểm tiêu chuẩn V = 4Z + 10 Ngày nay, để phù hợp với hệ thống điểm từ 0 -> 10, có
thể dùng điểm tiêu chuẩn V mới với trung bình = 5 và độ lệch tiêu chuẩn là 2. Điểm V
(mới) = 2Z + 5
Tổng quát, nếu ta đổi một điểm thô X sang một loại điểm tiêu chuẩn Xtc có
trung bình = Mtc và độ lệch tiệu chuẩn = stc nhờ trung gian điểm Z thì áp dụng công
thức: Điểm tiêu chuẩn Xtc = Stc Z + Mtc
Chúng ta đã làm quen với khái niệm điểm thô của bài trắc nghiệm cùng nhiều
loại điểm số khác thƣờng đƣợc sử dụng trong trắc nghiệm. Điểm thô là tổng điểm các
câu học sinh làm đúng. Điểm phần trăm đúng, thứ bậc bách phân, điểm tiêu chuẩn là
điểm đƣợc biến đổi từ điểm thô theo các cách khác nhau. Trong quá trình tiếp cận các
công thức tính ta cũng tìm hiểu cả ý nghĩa và giải thích công dụng của từng loại điểm.
Trong các loại điểm đã đề cập, ta chú ý nhiều đến điểm tiêu chuẩn vì các ƣu điểm của
nó. Tuy nhiên, ta cần nhớ rằng không có một loại điểm nào là hoàn hảo mà tùy thuộc
vào mục đích sử dụng, vào tính chất của bài thi mà ta chọn một loại điểm phù hợp.
27
1.3. Lý thuyết ứng đáp câu hỏi
Lý thuyết đánh giá cổ điển (CTT) là cách tiếp cận chi phối cho đến năm 1953
khi Frederic Lord đã công bố luận văn tiến sĩ của mình về Lý thuyết năng lực tiềm ẩn
(Latent Trait Theory). Vào những năm 1970, lý thuyết ứng đáp câu hỏi (IRT – Item
Response Theory) bƣớc đầu có những nghiên cứu một cách đột phá và đầy đủ. Đầu
những năm 2000 khi các công cụ tính toán (phần mềm chuyên dụng) hỗ trợ tốt hơn
ứng dụng IRT vào các hệ thống đánh giá, khảo thí mới thực sự diễn ra. Tuy nhiên các
trung tâm nghiên cứu về IRT chủ yếu vẫn Mỹ hoặc liên quan đến các trƣờng đại học ở
Mỹ. IRT đƣợc xây dựng dựa trên một số tiên đề và dựa trên một hàm phân bố xác suất
của năng lực thí sinh theo các tham số (độ khó,…) của câu hỏi.
1.3.1. Tổng quan về lý thuyết ứng đáp câu hỏi
Để đo lƣờng năng lực của thí sinh (TS), chúng ta cần bộ câu hỏi (CH) đƣợc
thiết kế đúng mục tiêu cần đo. Khi đó năng lực của thí sinh là một đại lƣợng ẩn, nó chỉ
đƣợc biểu hiện thông qua quan sát phản ứng của TS với các câu hỏi. Chúng ta cần
công nhận với nhau rằng:
- Năng lực tiềm ẩn (latent trait) cần đo chỉ có một chiều (unidimensionality),
hoặc ta chỉ quan tâm đo một chiều của năng lực đó mà các chiều năng lực khác không
ảnh hƣởng .
- Các câu hỏi trong một bài thi là độc lập với nhau địa tức là việc trả lời một
CH không ảnh hƣởng đến các CH khác trong cùng một đề thi.
Khi đó chúng ta sẽ có một tƣơng quan giữa năng lực của TS biểu hiện qua sự
ứng đáp của TS vỡi mỗi câu hỏi và bộ công cụ đo (bộ CH) độc lập địa phƣơng với
nhau (các câu hỏi không ảnh hƣởng lẫn nhau). Mô hình về mối tƣơng quan này đã
đƣợc Allen Birnbaum và Lord đề xuất mô hình vòm chuẩn (dạng phân phối chuẩn) để
biểu diễn mỗi quan hệ năng lực ứng đáp của TS với CH. Tuy nhiên mô hình toán học
của dạng vòm chuẩn là quá phức tạp, và Birnbaum còn đề xuất một mô hình có luôn
tham số độ khó, độ phân biệt nên việc tính toán ban đầu gặp rất nhiều khó khăn. Năm
1960 (thực ra năm 1953) George Rasch đề xuất một mô hình mới là mô hình logistic
thây thế cho mô hình vòm chuẩn, đồng thời Rasch chỉ đƣa vào mô hình của mình một
tham số là độ khó. Do vậy Rasch đã xây dựng đƣợc cơ sở lý thuyết của nó, phá dỡ các
28
rào cản mà mô hình của Lord và Birnbaum gặp phải. Thực tế sau này (những năm 70)
các nhà nghiên cứu thế hệ hai đã dễ dàng chứng mình đƣợc hai mô hình: Vòm chuẩn
và logistic là tƣơng đƣơng nhau đồng thời trên mô hình logistic ta có thể đƣa vào các
tham số khác ngoài độ khó nhƣ độ phân biệt, độ đoán mò,…. Chúng ta sẽ tiếp cận mô
hình logistic lần lƣợt một, hai, ba tham số ở đoạn sau.
Ứng với mỗi câu hỏi trong đề thi, dùng đề đo các năng lực khác nhau, mỗi năng
lực có các đáp ứng khác nhau lên câu hỏi. Theo [3, tr. 87] ngƣời ta giả định là có
một hàm đặc trưng câu hỏi (Hàm ĐTCH - Item Characteristic Function) phản ánh mối
quan hệ giữa các biến không quan sát đƣợc (năng lực của TS) và các biến quan sát
đƣợc (việc trả lời CH). Đồ thị biểu diễn hàm đó đƣợc gọi là đường cong đặc trưng câu
hỏi (Đƣờng cong ĐTCH - Item Characteristic Curve).
Đối với các cặp TS – CH, cần xây dựng một thang đo chung để biểu diễn mối
tƣơng tác giữa năng lực tiềm ẩn và đáp ứng với độ khó câu hỏi. Theo [3, tr. 87 – 88],
ta có thể biểu diễn năng lực tiềm ẩn của các TS bằng một biến liên tục θ dọc theo một
trục, từ –∞ đến +∞. Khi xét phân bố năng lực của một tập hợp TS nào đó, ta gán giá trị
trung bình của phân bố năng lực của tập hợp TS đó bằng không làm gốc của thang đo
năng lực, và độ lệch tiêu chuẩn của phân bố năng lực bằng 1. Chọn một thuộc tính của
CH để đối sánh với năng lực: tham số biểu diễn thuộc tính quan trọng nhất đó là độ
khó b của CH (cần lƣu ý là đại lƣợng độ khó ở đây sẽ đƣợc xác định khác với trong
CTT). Cũng theo cách tƣơng tự có thể biểu diễn độ khó của các CH bằng một biến liên
tục dọc theo một trục, từ –∞ đến +∞. Khi xét phân bố độ khó của một tập hợp CH nào
đó, ta chọn giá trị trung bình của phân bố độ khó đó bằng không (0), làm gốc của
thang đo độ khó, và độ lệch tiêu chuẩn của phân bố độ khó CH bằng 1.
1.3.2. Hàm đặc trưng câu hỏi
Có nhiều cách tiếp cận để xây dựng mô hình hàm đặc trƣng câu hỏi, nhƣng
cách xây dựng của Baker [10] là dễ hiểu và dễ tiếp cận. Tài liệu [3] của giáo sƣ Lâm
Quang Thiệp viết về vấn đề này cũng hết sức logic, súc tích và dễ hiểu. Theo [3, tr. 89
– 91], Giả thiết cơ bản sau đây của George Rasch, nhà toán học Đan Mạch, đƣợc đƣa
ra làm cơ sở để xây dựng mô hình hàm đáp ứng CH một tham số:
29
Một người có năng lực cao hơn một người khác thì xác suất để người đó trả lời
đúng một câu hỏi bất kì phải lớn hơn xác suất của người sau; cũng tương tự như vậy,
một câu hỏi khó hơn một câu hỏi khác có nghĩa là xác suất để một người bất kì trả lời
đúng câu hỏi đó phải bé hơn xác suất để trả lời đúng câu hỏi sau [16, tr. 117]
Với giả thiết nêu trên, theo [3, tr. 89 - 91] có thể thấy xác suất để một TS trả lời
đúng một CH nào đó phụ thuộc vào tƣơng quan giữa năng lực của TS và độ khó của
CH. Chọn Θ để biểu diễn năng lực của TS, và β để biểu diễn độ khó của CH. Gọi P là
xác suất trả lời đúng CH, xác suất đó sẽ phụ thuộc vào tƣơng quan giữa Θ và β theo
một cách nào đó, do vậy ta có thể biểu diễn: (1)
Trong đó f là một hàm nào đó của xác suất trả lời đúng. Lấy logarit tự nhiên
của (1)ta đƣợc : (2)
Khi xét mô hình trắc nghiệm nhị phân, Rasch chọn hàm f chính là mức được
thua (odds) O, hoặc khả năng thực hiện đúng (likelyhood ratio), tức là
biểu diễn tỉ số của khả năng trả lời đúng và khả năng trả lời sai nên
(3) Từ đó hay (4)
Hình 1.1 Đường cong ĐTCH một tham số
30
Biểu thức (4) chính là hàm đặc trƣng của mô hình ứng đáp CH 1 tham số, hay
còn gọi là mô hình Rasch, có thể biểu diễn bằng đồ thị dƣới đây (khi cho b = 0)
Tuy nhiên, nhƣ đã biết, trong CTT, ngƣời ta còn sử dụng một tham số quan
trọng thứ hai đặc trƣng cho CH là độ phân biệt, từ đó nhiều nhà nghiên cứu mong
muốn đƣa đặc trƣng đó vào mô hình đƣờng cong ĐTCH. Các mô hình 1, 2, 3 tham số
lần lƣợt đƣợc giới thiệu sau đây đƣợc viết khá kĩ và dễ hiểu trong [3, tr. 92 – 99]. Ta
có thể đƣa thêm tham số a liên quan đến đặc trƣng phân biệt của CH vào hệ số ở số
mũ của hàm e, kết quả sẽ có biểu thức: (5)
Hình 1.2 Các đường cong ĐTCH hai tham số với các giá trị a khác nhau (b= 0)
Hàm đáp ứng năng lực của CH (5) chính là hàm ĐTCH 2 tham số. Hệ số a biểu
diễn độ dốc của đƣờng cong ĐTCH tại điểm có hoành độ θ= b và tung độ P(θ) = 0,5.
Hàm ĐTCH 2 tham số trình bày trên đây và hàm ĐTCH 1 tham số theo mô hình Rasch
có cùng dạng thức, chỉ khác nhau ở giá trị tham số a (đối với mô hình 1 tham số a=1).
Hình 1.2 biểu diễn các đƣờng cong ĐTCH theo mô hình 2 tham số với b=0, và a lần
lƣợt bằng 0,5; 1,0; 1,5; 2,0; 3,0 nên độ dốc của các đƣờng cong ở đoạn giữa tăng dần.
Có thể thấy rằng tung độ tiệm cận trái của các đƣờng cong ĐTCH 1 và 2 tham số đều
có giá trị bằng 0, điều đó có nghĩa là nếu TS có năng lực rất thấp, tức là Θ → 0 và θ =
ln Θ → -∞, thì xác suất P(θ) trả lời đúng CH cũng bằng 0. Tuy nhiên, trong thực tế
triển khai trắc nghiệm, chúng ta đều biết có khi năng lực của TS rất thấp nhƣng do
đoán mò hoặc trả lời hú hoạ một CH nên TS vẫn có một khả năng nào đó trả lời đúng
31
CH. Trong trƣờng hợp đã nêu thì tung độ tiệm cận trái của đƣờng cong không phải
bằng 0 mà bằng một giá trị xác định c nào đó, với 0 < c < 1. Từ thực tế nêu trên, ngƣời
ta có thể đƣa thêm tham số c phản ánh hiện tƣợng đoán mò vào hàm ứng đáp CH để
tung độ tiệm cận trái của đƣờng cong khác 0. Kết quả sẽ thu đƣợc
(6)
Hình 1.3. Các đường cong ĐTCH 3 tham số với a = 2, c = 0,1 và 0,2.
Hàm đáp ứng năng lực của CH (6) chính là hàm ĐTCH 3 tham số. Rõ ràng khi
θ → -∞, hàm P(θ)→ c. Trong trƣờng hợp hàm ĐTCH 3 tham số khi θ = b sẽ có P(θ) =
(1+c)/2. Chúng ta đã chọn mô hình một tham số, mô hình Rasch, làm mô hình trình
bày đầu tiên trong các mô hình đƣờng cong ĐTCH vì mô hình này đơn giản nhất và
phản ánh tƣờng minh nhất mối quan hệ giữa TS và CH, sau đó chúng ta đã làm quen,
mở rộng với mô hình hai, ba tham số. Đã có rất nhiều các nghiên cứu so sánh chất
lƣợng đánh giá câu hỏi thi ở các mô hình 1, 2, 3 tham số. Nhƣng mô hình một tham số
vẫn đƣợc dùng phổ biến bởi tính đơn giản của nó. Tuy nhiên, nhƣ đã nói trên đây,
trong tiến trình lịch sử hình thành IRT, không phải mô hình Rasch xuất hiện trƣớc các
mô hình khác. Nhà toán học và tâm lý học ngƣời Đan Mạch, George Rasch, đã có ý
tƣởng xây dựng "một mô hình cấu trúc cho các CH trong một đề trắc nghiệm" từ thập
niên 1950, đề xuất mô hình xác suất logistic đó từ 1953, nhƣng ở Mỹ, ngƣời ta biết
đến công trình của ông từ khi ông công bố chính thức trong một cuốn sách xuất bản
năm 1960 [12]. Động cơ của Rasch muốn thể hiện qua mô hình của mình là hạn chế
việc dựa vào tổng thể TS khi phân tích các đề trắc nghiệm (ĐTN). Theo ông, phân tích 32
trắc nghiệm chỉ đáng giá khi dựa vào từng cá nhân TS, với các thuộc tính của TS và
CH đƣợc tách riêng. Quan điểm của Rasch đã đánh dấu sự chuyển tiếp từ CTT, dựa
trên tổng thể với việc nhấn mạnh đến biện pháp tiêu chuẩn hoá và ngẫu nhiên hoá,
sang IRT với mô hình xác suất tƣơng tác giữa một TS và một CH. Sự tồn tại của các
số liệu thống kê đầy đủ của các tham số của CH trong mô hình Rasch có thể đƣợc sử
dụng vào việc điều chỉnh ƣớc lƣợng các tham số năng lực theo một cách thức đặc biệt.
Để chi tiết hơn ta có thể tham khảo các tài liệu [Wikipedia], [3].
Theo [3], một trong những ƣu điểm lớn của mô hình Rasch là tách biệt đƣợc
năng lực của TS và đặc trƣng của CH (độ khó) trong phép đo lƣờng. Thật vậy, nếu có
hai TS có năng lực θ1 và θ2 cùng ứng đáp một CH thì từ biểu thức (3) có thể thu đƣợc
ln (O1/O2) = (θ1 – θ2), tức là có thể xác định các năng lực của TS không phụ thuộc độ
khó CH. Vì tính đối xứng của biểu thức, cũng dễ thấy rằng, ngƣợc lại, có thể xác định
các độ khó của CH không phụ thuộc năng lực TS. Chính vì tính chất cơ bản này nên
có thể đặt năng lực của các TS và độ khó của các CH trên cùng một thang đo để so
sánh chúng với nhau. Tuy nhiên, một số nhà nghiên cứu khác cho rằng về lý thuyết thì
dạng toán học của mô hình Rasch có nhiều lợi thế, nhƣng khi nói đến mô hình toán
học, tức là nói đến một sự giả định, tiêu chuẩn để đánh giá hiệu quả của mô hình là sự
phù hợp của chúng với số liệu thực nghiệm chứ không chỉ thuần túy ở dạng toán học.
Ngƣời ta thƣờng gọi quan điểm của Wright là quan điểm "dựa trên mô hình" (model–
based), còn quan điểm ngƣợc lại là quan điểm "dựa trên dữ liệu" (data–based).[3, tr.
98 – 99].
1.3.3. Điểm thực và đường cong đặc trưng đề trắc nghiệm
Đây là một khái niệm hoàn toàn mới, bởi trƣớc đây chúng ta thƣờng quen thuộc
với các điểm thô, điểm Z, điểm bách phân. Chúng chỉ phản ánh các con số khô khan
mang tính định danh và thứ tự mà chƣa phản ảnh rõ “tính chất” của đối tƣợng cần đo.
Trong các phép đo lƣờng, để xác định chính xác giá trị đƣợc đo và sai số của một phép
đo ngƣời ta thƣờng thực hiện phép đo đó nhiều lần. Trong trắc nghiệm, thực tế không
làm đƣợc nhƣ vậy, nhƣng có thể quy ƣớc định nghĩa về điểm trung bình của một TS
qua hàng loạt phép đo bằng một ĐTN. Điểm quan sát X của một ĐTN qua hàng loạt
phép đo đƣợc xem là một biến ngẫu nhiên với một phân bố tần suất nào đó thƣờng là
33
không biết. Giá trị trung bình của phân bố đó đƣợc gọi là điểm thực τ của TS, có quan
hệ nhƣ sau với các điểm quan sát X và sai số ε: ε = X – τ. (7)
Theo [3, tr. 117 – 128], trong CTT, điểm thực đƣợc định nghĩa trên đây là một
sự trừu tƣợng toán học, không có quy trình nào để xác định. Cũng do đó, sai số của
phép đo ε là một đại lƣợng có tính chất trung bình đối với toàn bộ dải năng lực của TS.
Tuy nhiên trong IRT, có thể chứng minh đƣợc rằng điểm thực đƣợc xác định bởi một
ĐTN gồm n CH có thể tính theo biểu thức sau đây: (8)
Tức là: điểm thực của một TS có năng lực θ là tổng của các xác suất trả lời
đúng của mọi CH của ĐTN tại giá trị θ. Nhƣ vậy, đối với mọi giá trị θ, nếu chúng ta
tiến hành cộng tất cả mọi đƣờng cong ĐTCH trong ĐTN, sẽ thu đƣợc đƣờng cong đặc
trƣng của ĐTN, hoặc cũng gọi là đƣờng cong điểm thực. Đƣờng cong đặc trƣng của
ĐTN là quan hệ hàm số giữa điểm thực và thang năng lực: cho trƣớc một mức năng
lực bất kì có thể tìm điểm thực tƣơng ứng qua đƣờng cong đặc trƣng ĐTN.
Hình 1.4. Đường cong đặc trưng của ĐTN gồm 5 CH và 5 đường cong ĐTCH tương ứng.
Minh họa trên Hình 1.4 cho thấy một đƣờng cong đặc trƣng ĐTN thu đƣợc
bằng cách cộng 5 đƣờng cong ĐTCH. Vì là chồng chất của các đƣờng cong ĐTCH
nên đƣờng cong đặc trƣng ĐTN cũng có dạng một hàm đồng biến. Tiệm cận phải của
đƣờng cong khi θ → +∞ bằng điểm thực tối đa, n, tức là bằng tổng số CH trong ĐTN.
Tung độ tiệm cận trái của đƣờng cong khi θ tiến đến θ → -∞ bằng 0 đối với các mô
hình 1 và 2 tham số, và bằng giá trị tổng cộng các tham số đoán mò Σcj của toàn
bộ n CH trong ĐTN đối với mô hình 3 tham số. Độ nghiêng của phần giữa đƣờng cong 34
đặc trƣng ĐTN liên quan đến độ phân biệt của ĐTN. Mức năng lực ứng với trung
điểm của thang điểm thực (n/2) xác định vị trí của ĐTN trên thang năng lực. Hoành độ
của điểm đó xác định độ khó của ĐTN. Hai yếu tố độ dốc và mức năng lực ở trung
điểm thang điểm thực mô tả khá rõ đặc tính của một ĐTN.
Một điều khá lý thú là, khi biết năng lực θ của một TS, nhờ đƣờng cong điểm
thực của một ĐTN cụ thể có thể xác định đƣợc điểm thực của TS thu đƣợc từ ĐTN đó
mà TS không cần phải làm ĐTN. Từ đó có thể tiên đoán điểm thực của TS hoặc tình
trạng TS đạt hay không đạt điểm cần thiết đối với một ĐTN mới.
1.3.4. Hàm thông tin của câu hỏi và của đề trắc nghiệm
Để đánh giá chất lƣợng các đề thi và so sánh định chuẩn các đề thi, ngƣời ta cần
xây dựng các tham số phản ánh tính chất nội tại của đề thi. Theo [3, tr. 129 – 136] mỗi
một CH trắc nghiệm cung cấp một lƣợng thông tin nào đó về năng lực cần đo của các
TS. Birnbaum A. đã đề xuất biểu thức hàm hàm thông tin của CH (item information
function) đƣợc biểu diễn nhƣ sau: (9)
Trong đó Ii(θ) là thông tin cung cấp bởi CH thứ i ở mức năng lực θ, Qi(θ)=1-
Pi(θ), P'i(θ)là đạo hàm của Pi(θ) theo θ. Từ biểu thức (9) có thể suy ra các biểu thức
hàm thông tin tƣơng ứng với các mô hình ứng đáp CH khác nhau. Đối với mô hình
tổng quát 3 tham số, ta có: (10)
Vì tính độc lập địa phƣơng của các CH trắc nghiệm, 'hàm thông tin của ĐTN
(Test information Function) là tổng các hàm thông tin của các CH có trong ĐTN:
(11)
35
Hình 1.5. Đồ thị các hàm thông tin của các CH trắc nghiệm
và của ĐTN do các CH đó hợp thành
Ở Hình 1.5 đƣờng cong nét đậm biểu diễn hàm thông tin của ĐTN, còn các
đƣờng cong nét nhạt là các hàm thông tin của các CH trắc nghiệm. Mức thông tin
chung của ĐTN cao hơn nhiều so với mức thông tin của từng CH riêng rẽ, tức là một
ĐTN sẽ đo năng lực chính xác hơn nhiều so với chỉ một CH trắc nghiệm. Từ định
nghĩa hàm thông tin theo công thức (11) có thể thấy rõ: ĐTN càng có nhiều CH thì giá
trị của hàm thông tin càng cao, tức là một ĐTN dài thƣờng đo năng lực chính xác hơn
một ĐTN ngắn. Tùy theo tính chất của các CH tạo nên ĐTN mà hàm thông tin sẽ có
giá trị lớn (tức là đo chính xác) ở các khoảng năng lực xác định nào đó và giá trị bé
(tức là đo kém chính xác) ở các khoảng năng lực khác. Do những đặc điểm nêu trên,
hàm thông tin là một công cụ cực kì quan trọng của IRT, nó giúp thiết kế các ĐTN cho
các phép đo theo các mục tiêu xác định. Hàm thông tin lý tƣởng của một ĐTN là một
đƣờng nằm ngang, tức là phép đo có độ chính xác nhƣ nhau ở mọi khoảng năng lực.
Tuy nhiên, một ĐTN nhƣ vậy có thể không phải là tốt nhất đối với các mục tiêu cụ thể.
Chẳng hạn, nếu muốn thiết kế một ĐTN để cấp học bổng, cần một ĐTN đo rất chính
xác trong một khoảng hẹp ở mức năng lực là ranh giới giữa những TS đƣợc và không
đƣợc học bổng, tức là hàm thông tin có đỉnh cực đại ở điểm cắt (cut–off score), vì rằng
một sai số lớn trong phép đo ở khoảng năng lực này có thể chuyển một TS từ loại
đƣợc sang loại không đƣợc học bổng hoặc ngƣợc lại.
36
Sai số tiêu chuẩn của ĐTN: Sai số tiêu chuẩn của việc ƣớc lƣợng năng lực ở vị
trí θ bằng: (12)
Biểu thức (12) cho thấy hai đƣờng cong hàm thông tin và sai số tiêu chuẩn của
một ĐTN có hình dạng gần nhƣ đối xứng với nhau qua một đƣờng nằm ngang. Sự phụ
thuộc của sai số tiêu chuẩn Ϭ vào năng lực θ có một ý nghĩa quan trọng, chỉ rõ một
trong những khác biệt giữa CTT và IRT. Biểu thức (7) cho thấy trong CTT sai số ε của
phép đo là một đại lƣợng không đổi chung cho ĐTN đối với mọi TS có năng lực khác
nhau. Trong khi đó, đối với IRT, sai số của phép đo bằng ĐTN thay đổi theo các mức
năng lực. Đây cũng là một biểu hiện của việc "cá thể hoá" phép đo lƣờng của IRT mà
chúng ta đã đề cập khi bàn về mô hình Rasch trên đây.
Sai số tiêu chuẩn Ϭ(θ) của việc ƣớc lƣợng năng lực θ là độ lệch tiêu chuẩn của
phân bố gần chuẩn khi ƣớc lƣợng giá trị năng lực theo biến cố hợp lý cực đại ở một giá
trị năng lực θ nào đó. Phân bố sẽ tiến đến dạng chuẩn khi ĐTN đủ dài. Tuy nhiên,
nhiều nghiên cứu cho thấy rằng thậm chí các ĐTN ngắn cỡ 10 – 20 CH, sự phân bố
gần chuẩn cũng thoả mãn đối với một số mục đích.
Biên độ của hàm sai số tiêu chuẩn nói chung phụ thuộc vào: (1) số CH trong
ĐTN (số CH càng lớn sai số tiêu chuẩn càng bé); (2) chất lƣợng các CH của ĐTN (nói
chung các CH càng có độ phân biệt cao và khả năng đoán mò thấp sẽ tạo sai số tiêu
chuẩn bé); (3) độ khó CH gần với giá trị năng lực đƣợc đo (tức là ĐTN không quá khó
và không quá dễ). Việc tăng số CH trong ĐTN hoặc chọn các CH với giá trị hàm
thông tin lớn sẽ làm tăng giá trị thông tin của ĐTN và giảm sai số tiêu chuẩn; tuy
nhiên khi hàm thông tin vƣợt quá một giá trị nào đó thì sai số tiêu chuẩn sẽ trở nên ổn
định và sự tăng tiếp tục của hàm thông tin sẽ có tác động không lớn lên giá trị của sai
số tiêu chuẩn.
Áp dụng hàm thông tin vào việc khảo sát và thiết kế ĐTN: Hàm thông tin của
ĐTN có một số ứng dụng quan trọng. Trƣớc hết, qua hàm thông tin có thể biết mức độ
chính xác của phép đo bằng ĐTN: Giá trị hàm thông tin càng lớn ở khoảng năng lực
nào thì độ chính xác của phép đo ở khoảng năng lực đó càng cao, và ngƣợc lại. Một
ứng dụng khác rất quan trọng của hàm thông tin là giúp thiết kế các ĐTN có mức
37
tƣơng đƣơng cao. Theo IRT, các ĐTN tƣơng đƣơng phải thoả mãn hai điều kiện: (1)
điều kiện về nội dung và mục tiêu, thể hiện ở sự trùng hợp của các ma trận đặc trƣng
ĐTN (số lƣợng câu hỏi trong các ô ứng với nội dung và mục tiêu học tập cụ thể phải
trùng nhau); (2) điều kiện về thống kê: các đƣờng cong hàm thông tin của các ĐTN
phải trùng khớp nhau trong một phạm vi sai số chấp nhận nào đó.
1.3.5. Ước lượng năng lực thí sinh và tham số câu hỏi
Nhƣ đã biết, các mô hình IRT xét mối tƣơng tác của một TS có năng lực θ với
một CH có các tham số a, b, c. Tuy nhiên, trong hoạt động đánh giá thực tế, cái mà
chúng ta có thể thu đƣợc trực tiếp từ số liệu kiểm tra là việc trả lời các CH của các TS
qua bài trắc nghiệm. Từ các số liệu thu đƣợc trực tiếp đó làm sao xác định các tham
số a, b, c' của các CH và năng lực θ của các TS? Đó là bài toán cơ bản và quan trọng
nhất của IRT, vì năng lực của TS là cái cuối cùng mà ta muốn biết, còn các tham số
của CH là cần thiết để chúng ta có thể sử dụng các CH nhằm thiết kế các công cụ thích
hợp để đo lƣờng chính xác năng lực của TS. Bài toán quan trọng đó đƣợc giải quyết
bằng các thuật toán ƣớc lƣợng năng lực TS và tham số CH, việc tìm ra các thuật toán
tốt nhất để giải bài toán này là một trong các mục tiêu quan trọng của IRT, và có thể
nói quyết định thành công của việc áp dụng IRT vào thực tế hoạt động đánh giá. Tuy
nhiên, muốn trình bày đầy đủ thuật toán đã nêu cần nhiều kiến thức về toán học và
thống kê học. Bạn đọc muốn đi sâu vào những vấn đề đó có thể tìm hiểu sơ bộ ở [10] ,
và đầy đủ hơn trong [3].
1.3.6. So bằng và kết nối các đề trắc nghiệm
Theo IRT, về nguyên tắc, các tham số CH xác định đƣợc không phụ thuộc vào
mẫu TS, và năng lực TS đo đƣợc không phụ thuộc vào ĐTN cụ thể. Tuy nhiên đó là
các tính chất lý tƣởng, chỉ tuyệt đối đúng trong cả tổng thể khảo sát khi số liệu thực tế
hoàn toàn phù hợp với mô hình giả định, và các giả thiết khác về mô hình đƣợc tuân
thủ. Thao tác đƣa tham số của các CH cũng nhƣ năng lực TS về thang đo chung gọi
là so bằng (equating). So bằng là yêu cầu rất quan trọng trong thực tiễn đánh giá.
Chẳng hạn, có hai mẫu TS khác nhau đƣợc đánh giá bằng hai ĐTN khác nhau, năng
lực của mỗi mẫu TS đƣợc một ĐTN đo lƣờng và thu đƣợc một bộ điểm. Muốn hai bộ
điểm của hai mẫu TS thu đƣợc từ hai ĐTN có thể so sánh đƣợc với nhau, ngƣời ta phải
38
chuyển chúng về một thang đo chung, tức là so bằng. Cũng vậy, nếu hai ĐTN đƣợc
triển khai trên hai nhóm TS khác nhau để định cỡ (calibration) các CH trắc nghiệm,
tức xác định các tham số của chúng, từ mỗi ĐTN sẽ thu đƣợc một bộ tham số của các
CH. Muốn tham số của các CH của ĐTN thu đƣợc từ hai mẫu TS có thể so sánh đƣợc
với nhau ngƣời ta cũng phải dùng thủ thuật so bằng nhằm chuyển các tham số của CH
về một thang đo chung. Sau khi so bằng, mỗi giá trị tham số của CH từ hai ĐTN đƣợc
đặt trên cùng một thang đo nên có thể so sánh với nhau, chẳng hạn để lựa chọn CH có
tham số thích hợp nhằm thiết kế một ĐTN theo yêu cầu xác định. Có nhiều thủ tục so
bằng khác nhau. Bạn đọc muốn tìm hiểu có thể tham khảo trong [10], hoặc tỉ mỉ hơn
trong [13]
1.3.7. Về trắc nghiệm đa phân và trắc nghiệm đa chiều
Khi đặt vấn đề xây dựng mô hình toán phản ánh sự ứng đáp CH ở phần đầu, để
đơn giản cho mô hình, chúng ta đã giả thiết là việc ứng đáp kiểu nhị phân (0,1). Tuy
nhiên, trong thực tế đánh giá ngƣời ta còn sử dụng loại CH với kiểu ứng đáp đa
phân (polytomous) hoặc đánh giá một năng lực đa chiều (multidimentionality) hay
đánh giá đồng thời nhiều chiều của năng lực. Dƣới đây sẽ giới thiệu khái quát về trắc
nghiệm đa phân và đa chiều. Đây là các đặc điểm tƣơng đổi mới trong IRT bới sự
phức tạp của các mô hình đi kèm, các nghiên cứu chính chủ yếu trong các tài liệu [14],
[15]. Các kết quả chủ yếu đƣợc công bố từ đầu những năm 2000. Tuy nhiên đây là các
ƣu điểm nổi trội của IRT, khắc phục việc CTT chỉ phân tích đƣợc các câu hỏi nhị phân
mà không thể phân tích ĐTN với các câu hỏi nhị phân, đa phân và đa chiều. Theo [3,
tr. 218 – 260] ta sẽ xem xét cụ thể các mô hình này.
1.3.7.1. Mô hình trắc nghiệm đa phân
Ngoài các loại trắc nghiệm nhiều lựa chọn mà trả lời theo hai trạng thái nhị
phân (0,1), ngƣời ta còn sử dụng các loại bảng hỏi (questionaire) với kiểu trả lời theo
thang Likert: „‟rất không đồng ý, không đồng ý, đồng ý, rất đồng ý‟‟ trong các điều tra
giáo dục hoặc xã hội học nói chung, hoặc các câu hỏi tự luận bao gồm nhiều phần, mỗi
phần đƣợc định các mức điểm khác nhau, có thể gọi chung là các câu hỏi với ứng đáp
đa phân (polytomous). Một số nhà nghiên cứu cũng đã lƣu ý đến mô hình trắc nghiệm
đa phân từ cuối thập niên 1960 và tập trung mạnh mẽ từ đầu thập niên 1980. Nhà
39
nghiên cứu quan tâm đến mô hình đa phân sớm nhất có lẽ là Samejima ngƣời đã đƣa
vào mô hình ứng đáp đa cấp (graded response model) [14]. Sau đó có hàng loạt mô
hình đƣợc đề xuất, nhƣng tổng quát nhất có lẽ là mô hình định giá từng phần (Partial
Credit Model – PCM) của Master, G.N.
Để thiết lập PCM, Masters xét một CH có nhiều hạng (category) điểm để TS
đạt đƣợc, và giả định rằng xác suất để TS đạt hai hạng điểm kế tiếp nhau tuân theo quy
luật của mô hình Rasch nhị phân. Dựa vào giả định nêu trên, khi CH thứ i là đa phân
với các hạng điểm 0, 1, 2,..., mi thì Masters thu đƣợc xác suất để TS n đạt điểm x của
CH thứ i sẽ là: (13) trong đó, để tiện trong việc ký
hiệu, chúng ta quy định
Lƣu ý rằng trong biểu thức (13), δik đóng vai trò nhƣ b trong mô hình Rasch nhị
phân. Với quan niệm của Masters, chúng ta có thể mô tả diễn biến của xác suất trả lời
đúng CH (đạt hạng điểm 1) theo năng lực θ của mô hình Rasch nhị phân ứng bởi biểu
thức (4) bằng đƣờng cong P(X = 1) và xác suất trả lời sai CH (đạt hạng điểm 0) bằng
đƣờng cong P(X = 0) trên cùng một đồ thị ở Hình 1.6
Hình 1.6. Các đường cong ĐTCH trắc nghiệm nhị phân ứng với
xác suất trả lời sai P(X = 0) và xác suất trả lời đúng P(X = 1)
Tƣơng tự, trong trƣờng hợp CH có 3 hạng điểm 0, 1 và 2 các đƣờng biểu diễn
ứng với 3 hạng điểm có dạng nhƣ Hình 1.7
40
Hình 1.7. Các đường cong ĐTCH của một CH PCM có 3 hạng điểm (với δ1<δ2).
1.3.7.2. Mô hình trắc nghiệm đa chiều
Khi xây dựng các mô hình ứng đáp CH, để đơn giản hoá, chúng ta đã đặt điều
kiện về tính đơn chiều (unidimentionality) của CH, tức là CH chỉ đo một thứ năng lực
tiềm ẩn, hoặc ta chỉ đo một chiều (dimension) của năng lực tiềm ẩn đa chiều
(multidimentionality). Tuy nhiên, trong thực tế, để thực hiện một ứng đáp nào đó, TS
thƣờng phải có các chiều khác nhau của năng lực, chẳng hạn để giải một bài toán, TS
cần cả kĩ năng đọc hiểu đề toán và các kĩ năng toán học. Reskase đã dựa vào trắc
nghiệm nhị phân (0,1) đơn chiều mở rộng ra mô hình trắc nghiệm nhị phân đa chiều
[15]. Trong mỗi TS các năng lực tiềm ẩn là khác nhau. Ví dụ khi làm bài kiểm tra
toán, thì năng lực giải toán hình học, đại số của TS là khác nhau. Với trƣờng hợp TS
có hai chiều năng lực θ1 và θ2, có thể vẽ đƣợc mặt cong đặc trƣng CH nhƣ ở Hình 1.8
Hình 1.8. Mặt ĐTCH với 2 chiều năng lực θ1,θ2
41
Về cách biểu hiện tính đa chiều, nhiều nhà nghiên cứu đƣa vào khái niệm tính
đa chiều giữa các CH và trong từng CH. Một bài trắc nghiệm là đa chiều giữa các CH
nếu nó bao gồm nhiều bài trắc nghiệm con đơn chiều. Một bài trắc nghiệm là đa chiều
trong từng CH nếu mỗi CH đòi hỏi nhiều chiều năng lực tiềm ẩn để trả lời. Hai kiểu đa
chiều của bài trắc nghiệm đƣợc minh hoạ ở Hình 1.9.
Hình 1.9. Hai kiểu biểu hiện tính đa chiều của các câu hỏi trắc nghiệm.
Ở nửa bên trái Hình 1.9 mô tả bài trắc nghiệm 3 chiều gồm 9 CH theo kiểu đa
chiều giữa các CH, mỗi chiều đƣợc đánh giá riêng biệt bởi 3 CH. Nửa bên phải của
Hình 1.9 mô tả bài trắc nghiệm 3 chiều gồm 9 CH với cả hai kiểu đa chiều giữa các
CH và đa chiều trong từng CH, trong đó 4 CH 1, 5, 8, 9 chỉ đo một chiều năng lực, còn
các CH khác đo đồng thời 2 hoặc 3 chiều năng lực. [3]
1.3.8. Ví dụ về ước lượng tham số câu hỏi
Với các mô hình IRT 2 và 3 tham số, quá trình ƣớc lƣợng cũng đƣợc thực hiện
theo nguyên tắc tƣơng tự nhƣ đã mô tả trên đây, tuy số tham số tính toán nhiều hơn.
Một trong các thuật toán thƣờng đƣợc sử dụng cho quy trình ƣớc lƣợng nói trên là
thuật toán biến cố hợp lý cực đại và nhiều thuật toán khác đƣợc trình bày trong [13].
Vì việc thực hiện bài toán ƣớc lƣợng giá trị năng lực của TS và các tham số của CH
khá phức tạp nên đa số bạn đọc thông thƣờng không cần phải bận tâm nhiều đến các
thuật toán cụ thể, bởi vì ngày nay đã có nhiều phần mềm chuyên dụng đƣợc các
42
chuyên gia tâm trắc học xây dựng phục vụ các bài toán ƣớc lƣợng đó. Chẳng hạn sau
đây là một số phần mềm đƣợc sử dụng tƣơng đối phổ biến hiện nay: CONQUEST của
Úc và WINSTEPS của Mỹ cho mô hình Rasch (một tham số) nhị phân và đa phân,
BILOG–MG3 của Mỹ cho mô hình 1, 2, 3 tham số nhị phân, PARSCALS,
MULTILOG cho mô hình đa phân,... Ở Việt Nam phần mềm đầu tiên phục vụ cho bài
toán này là VITESTA, cho các mô hình 1, 2, 3 tham số nhị phân và đa phân, đƣợc
công ty EDTECH–VN xây dựng từ năm 2007 [2]. Ta xét một ví dụ cho quá trình ƣớc
lƣợng các tham số của câu hỏi.
Để phù hợp với quá trình tính toán bằng tay ta xét một hình một tham số.
Chúng ta xem xét một bài kiểm tra điển hình. Với N câu hỏi và với M ngƣời tham gia
kiểm tra. Điểm số của những ngƣời kiểm tra này sẽ đƣợc phân bổ trong một mức độ
khả năng về dải năng lực của thí sinh. Những ngƣời kiểm tra này đƣợc chia thành J số
nhóm cùng có cùng năng lực để tất cả ngƣời kiểm tra trong một nhóm nhất định có
cùng cấp độ năng lực θj và sẽ có mj ngƣời kiểm tra bên trong nhóm j, trong đó j = 1, 2,
3. . . J. Xét một câu hỏi nào đó thì trong cùng một nhóm có rj ngƣời kiểm tra trả lời
đúng câu hỏi đã cho. Nhƣ vậy, ở mức độ năng lực θj,tỷ lệ đáp ứng đúng là p(θj) = rj /
mj, là ƣớc tính của xác suất trả lời chính xác ở mức khả năng θj. Bây giờ có thể thu
đƣợc giá trị của rj và p (θj) đƣợc tính cho mỗi cấp độ khả năng j đƣợc thiết lập theo dải
năng lực J. Nếu tỷ lệ đáp ứng chính xác trong mỗi nhóm khả năng đƣợc vẽ, kết quả sẽ
là giống nhƣ thể hiện trong hình 1.10
Hình 1.10. Mô tả đáp ứng câu hỏi
43
Nhiệm vụ tiếp theo là tìm ra đƣờng cong đặc trƣng của câu hỏi (ICC) phù hợp
nhất với tỷ lệ phản ứng đúng hay kết quả làm bài đối với câu hỏi của thí sinh. Để làm
nhƣ vậy, một mô hình cần phải đƣợc lựa chọn cho các ICC. Mặc dù bất kỳ một trong
ba mô hình có thể đƣợc sử dụng, mô hình hai tham số đƣợc sử dụng ở đây với
. Các thủ tục đƣợc sử dụng để phù hợp đƣờng cong dựa trên ƣớc
tính khả năng ƣớc lƣợng tối đa. Theo cách tiếp cận này, giá trị ban đầu cho các thông
số của câu hỏi cần đƣợc khởi tạo trƣớc, chẳng hạn nhƣ b = 0.0, a = 1.0. Sau đó, sử
dụng các ƣớc lƣợng để tính giá trị của P(θj) đƣợc tính tại mỗi nhóm năng lực thông
qua phƣơng trình cho ICC mô hình. Lƣu ý giá trị quan sát đƣợc của năng lực p(θj) và
giá trị tính toán P (θj) đƣợc xác định trên tất cả các nhóm năng lƣc. Sau đó, điều chỉnh
các tham số câu hỏi (a, b) ƣớc tính đƣợc để kết quả giữa P (θj) và p(θj) gần sát nhau
hơn nữa. Khi đó ICC đƣợc xác định bởi các giá trị ƣớc tính toán của các tham số thông
kê và tỷ lệ quan sát đƣợc của đƣờng cong đặc trƣng câu hỏi. Quá trình điều chỉnh ƣớc
tính này là tiếp tục cho đến khi các điều chỉnh quá nhỏ mà ít sự sai số giữa P (θj) và
p(θj) không còn đáng kể. Tại thời điểm này, thủ tục ƣớc lƣợng đƣợc chấm dứt và các
giá trị hiện tại của b và a là ƣớc lƣợng tham số câu hỏi. Với các giá trị này, phƣơng
trình cho ICC đƣợc sử dụng để tính xác suất phản ứng chính xác P (θj) ở mỗi cấp độ
năng lực và ICC có thể đƣợc vẽ. Đƣờng cong kết quả là ICC phù hợp nhất với dữ liệu
phản hồi của mục đó. Hình 2.2 cho thấy một ICC phù hợp với tỷ lệ quan sát đƣợc của
phản ứng chính xác thể hiện trong hình 2.1. Các giá trị ƣớc tính của các thông số mục
là b = -37 và a = 1,25.
44
Hình 1.11 Hàm đặc trưng câu hỏi
Nhƣ vậy với câu hỏi i nào đó sẽ có hàm đặc trƣng câu hỏi .
Để xét sự trùng khớp giữa P (θj) và p(θj) tốt ngƣời ta thƣờng dùng chỉ số Chi- bình
phƣơng nhỏ hơn một số tiêu chuẩn chọn trƣớc nào. Với các
câu hỏi mà quá trình trên khó hội tụ giữa hai giá trị P (θj) và p(θj) (Chi- bình phƣơng
luôn lớn số tiêu chuẩn đƣợc chọn) thì câu hỏi đó nên bị loại vì yếu tố kĩ thuật. Đó là
mô hình đƣờng cong đƣợc chọn không phù hợp (một, hai, ba tham số, …) hoặc giá trị
đáp ứng câu hỏi này rất phân tán nên phải chỉnh sửa lại câu hỏi hoặc loại bỏ.
Để đơn giản ta xét ví dụ sau, chúng ta hãy nhìn vào một ví dụ minh hoạ số cho
ƣớc lƣợng tham số câu hỏi. Để đơn giản và dễ hiểu ta xét mô hình Single Parameter
của Rasch minh hoạ. Do đó, một tham số duy nhất là độ khó của câu hỏi đƣợc ƣớc
tính. Chúng ta hãy lấy một ví dụ về một bài kiểm tra loại khách quan gồm 20 bài cho
76 thí sinh. Bảng dƣới đây minh họa dữ liệu về số điểm bên phải và số ngƣời kiểm tra
nhận đƣợc mỗi điểm:
45
Bảng 1.4. Dữ liệu thử nghiệm của câu hỏi thi
Số ngƣời trong nhóm
Nhóm năng lực (đƣợc phân chia bằng điểm số )
Xác xuất trả lời đúng p(θj) = rj / mj
Số câu trả lời đúng của nhóm năng lực trên tổng số ngƣời của nhóm 4
18
4
1
17
4
4
1
16
5
2
0.4
15
12
5
0.41
14
7
1
0.14
13
10
6
0.6
12
8
2
0.25
11
11
1
0.09
10
5
1
0.2
9
6
0
0
8
2
1
0.5
7
1
1
1
6
1
0
0
Đối với tỷ lệ câu trả lời đúng và nhóm điểm số bên phải cho ở trên, đồ thị đƣợc
vẽ với một ICC gần đúng nhƣ hình dƣới đây
Hình 1.12. Ước lượng hàm đặc trưng của câu hỏi
46
Một biểu đồ đồ họa thô của tỷ lệ các câu trả lời đúng ở mọi năng lực, số điểm
đƣợc vẽ lên đối với số điểm đúng đƣợc thu đƣợc bằng phƣơng pháp thử và sai số trong
đƣờng cong phù hợp. Biểu diễn thô đƣợc đƣa ra trong đồ thị. Có thể thấy rằng điểm
của đƣờng cong của đáp ứng đƣợc nhìn thấy ở một số điểm số bên phải là 15 tƣơng
ứng với một thô ƣớc tính 15 số đúng số và tƣơng ứng +1.5 trên thang điểm về khả
năng nhƣ đã nêu trong đồ thị. Giả sử ƣớc tính đầu tiên của độ khó b, của câu hỏi này
1.5. Cho một một tham số b = 1.5, ICC hoặc IRF thu đƣợc bằng cách sử dụng phần
mềm BIRT nhƣ hình dƣới đây:
Hình 1.13 Tham số ước lượng của câu hỏi
Hình 1.14 Đồ thị hàm đặc trưng của câu hỏi
47
Đƣờng cong BIRT của Pi (θ) ở tất cả các giá trị từ -3 đến +3 có thể đƣợc so
sánh với đạt đƣợc tỷ lệ các câu trả lời đúng ở mức điểm số ngay ở mức tƣơng ứng giả
định mức độ khả năng nhƣ thể hiện trong bảng dƣới đây:
48
Bảng 1.5 Dữ liệu tính toán ước lượng hàm đặc trưng câu hỏi
Nhóm năng lực
Dải năng lực
Xác xuất trả lời đúng quan sát đƣợc pi (θj)
18 17 16 15 14 13 12 11 10 9 8 7 6
1.0 1.0 0.4 0.41 0.14 0.6 0.25 0.09 0.2 0 0.5 1 0
Xác xuất đáp ứng câu hỏi của nhóm năng lực Pi (θj) 0.894 0.805 0.67 0.5 0.33 0.195 0.106 0.055 0.028 0.014 0.007 0.003 0
+3 +2.5 +2 +1.5 +1 +0.5 +0 -0.5 -1 -1.5 -2 -2.5 -3
Ta có hàm một tham số
với b =1.5 thì
Chi bình phƣơng đƣợc tính từ công thức
Số ngƣời trong nhóm
Q(θj)=1- P(θj)
Xác xuất trả lời đúng quan sát đƣợc
Xác xuất đáp ứng câu hỏi của nhóm năng lực
Nhóm năng lực
mj
4 4 5 12 7 10 8 11 5 6 2 1 1
18 17 16 15 14 13 12 11 10 9 8 7 6
pi (θj) 1.0 1.0 0.4 0.41 0.14 0.6 0.25 0.09 0.2 0 0.5 1 0
Pi (θj) 0,894 0,805 0,67 0,5 0,33 0,195 0,106 0,055 0,028 0,014 0,007 0,003 0
0,106 0,195 0,33 0,5 0,67 0,805 0,894 0,945 0,972 0,986 0,993 0,997 1
0,011236 0,038025 0,0729 0,0081 0,0361 0,164025 0,020736 0,001225 0,029584 0,000196 0,243049 0,994009 0
0,474273 0,968944 1,648575 0,3888 1,142922 10,44912 1,750538 0,259259 5,435038 0,085193 69,9321 332,3333 0 424,8681
Bảng 1.6. Dữ liệu tính toán ước lượng hàm đặc trưng câu hỏi
49
Nhƣ vậy chỉ số là quá lớn ta phải thay đổi tham số b (theo hai chiều hƣớng:
tăng lên và giảm đi) ví dụ b=1.51.451.4…1, giảm (tăng) đến khi chỉ số
nhỏ trong ngƣỡng cho phép. Quá trình kết thúc khi các ứng đáp câu hỏi quan sát đƣợc
và ƣớc lƣợng tham của câu hỏi có đồ thị “tiệm cận” với nhau nhƣ hình vẽ.
Hình 1.15. Đồ thị của hàm đặc trưng câu hỏi
Nếu quá trình trên không thu đƣợc hợp lý thì hoặc là ta bỏ câu hỏi thi, hai là
ta sửa lại câu hỏi.
Lƣu ý quá trình ƣớc lƣợng trên không phụ thuộc vào mẫu (nếu mẫu có năng lực
thấp, hay năng lực cao đều không ảnh hƣởng tới quá trình ƣớc lƣợng tham số). Đây là
một ƣu điểm nổi bất của IRT. Nó giúp ta có thể ƣớc lƣợng đề thi với các mẫu không
phổ quát mà vẫn không lo ảnh hƣởng tới chất lƣợng đề thi.
Dƣới đây là hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu khác nhau
50
Hình 1.16.. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực thấp
Hình 1.17. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực cao
Hình 1.18. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực phổ quát 51
Khi tất cả các câu hỏi trong đề thi đƣợc ƣớc lƣợng tham số, tức là với mỗi câu
hỏi i nào đó ta có hàm đặc trƣng của nó: . Trong một đề có N câu
hỏi thi, ta sẽ có tƣơng ứng n hàm đặc trƣng cho từng câu hỏi thi.
Mặc dù giả định rằng thang đo số liệu đƣợc biết đến, các giá trị số của các tham
số câu hỏi thi và các thông số về khả năng của ngƣời kiểm tra có thể đƣợc thể hiện
bằng số liệu này. Các nhà soạn đề thi cần biết những đặc tính nào họ cần đo lƣờng về
thí sinh để thiết kế các hỏi thi phù hợp cho những thí sinh có khả năng thấp, trung bình
hoặc cao. Nhƣng không thể xác định các giá trị của các tham số của độ phân biệt a
giữa các nhóm thí sinh cần đo. Ngoài ra, khi một bài kiểm tra đƣợc thực hiện cho một
nhóm thí sinh, không biết trƣớc bao nhiêu của các đặc điểm tiềm ẩn của mỗi ngƣời thí
sinh sở hữu. Do đó, một nhiệm vụ chính là xác định các giá trị của tham số câu hỏi và
khả năng của thí sinh trong một câu hỏi cho các đặc điểm ẩn tiềm ẩn. Trong IRT,
nhiệm vụ này là đƣợc gọi là hiệu chuẩn kiểm tra, và nó cung cấp một khung tham khảo
để giải thích các kết quả kiểm tra. Kiểm tra hiệu chuẩn đƣợc thực hiện bằng cách thực
hiện một bài kiểm tra cho một nhóm thí sinh M và câu trả lời nhị phân của thí sinh đối
với N câu hỏi trong đề thi. Sau đó các công thức, thủ tục toán học đƣợc áp dụng cho
dữ liệu ứng đáp câu hỏi để tạo ra mô hình năng lực, mô phỏng bám sát năng lực tiềm
ẩn của thí sinh. Sau đó, các giá trị của ƣớc lƣợng tham số câu hỏi và năng lực của thí
sinh đƣợc thể hiện bằng số liệu này.
52
CHƢƠNG 2
TỔ CHỨC VÀ THỰC HIỆN XÂY DỰNG ĐỀ THI
2.1. Đặt vấn đề
Cho đến nay các loại lý thuyết đo lƣờng và các mô hình đo lƣờng khác nhau đã
đƣợc giới thiệu rộng rãi ở Việt Nam trong. Với mong muốn tiếp cận lý thuyết khảo thí
hiện đại, luận văn này dự định tập trung vào nghiên cứu trong lĩnh vực kiểm tra môn
toán học lớp 12 bằng lý thuyết IRT. Lý thuyết IRT đã đƣợc biết đến từ những năm 50
của thế kỷ trƣớc và đƣợc giới thiệu về Việt Nam từ những năm 2000, nhƣng hiện nay
việc xây dựng một đề thi trên cơ sở lý thuyết IRT vẫn chƣa đƣợc phổ biến. Cách xây
dựng đề thi vẫn chủ yếu theo lý thuyết đánh giá cổ điển (các kì thi THPT QG là ví dụ),
IRT mới chủ yếu đƣợc ứng dụng trong các phân tích kết quả thi. Có nhiều lý do cho
vấn đề này. Thực ra các lý thuyết kiểm tra cổ điển và lý thuyết IRT không loại trừ, đối
lập nhau mà thƣờng bổ xung các ƣu điểm cho nhau. Mặt khác việc thực thi, ứng dụng
lý thuyết IRT vào việc xây dựng đề thi ở Việt Nam gặp nhiều khó khăn. Thứ nhất là
đội ngũ nghiên cứu chuyên sâu ở trong nƣớc là chƣa nhiều, chƣa có cộng đồng. Thứ
hai các mô hình toán học phức tạp trong IRT cần có những công cụ, phần mềm chuyên
dụng để tính toán. Thứ ba lý thuyết đánh giá cổ điển vẫn đáp ứng tƣơng đối tốt các yêu
cầu từ các kỳ thi của bộ giáo dục.
Tuy vậy, thực tế đo lƣờng trong giáo dục là vấn đề ngày càng đƣợc quan tâm
sát sao trƣớc yêu cầu đổi mới kiểm tra đánh giá trong giáo dục. Các nền tảng của đo
lƣờng đánh giá đƣợc biết đến hiện nay hoặc là dựa trên lý thuyết kiểm tra cổ điển hoặc
dựa trên IRT hoặc là sự kết hợp của cả hai. Dựa trên các hiểu biết hạn hẹp của cá nhân,
luận văn cố gắng xây dựng một đề đánh giá môn toán lớp 12 trên cở sở của lý thuyết
khảo thí hiện đại.
2.2. Quy trình xây dựng một đề thi, đề kiểm tra
Một đề kiểm tra tiêu chuẩn hóa thƣờng đƣợc thiết kế bởi các câu hỏi (CH) chọn
từ một ngân hàng câu hỏi (NHCH). NHCH là tập hợp một số lƣợng tƣơng đối lớn các
câu hỏi, trong đó mỗi CH đƣợc mô tả gắn với các phần nội dung xác định và các tham
số của nó. Trong trƣờng hợp CH trắc nghiệm thì đó là độ khó, độ phân biệt theo lý
53
thuyết trắc nghiệm cổ điển, là các tham số a, b, c theo IRT. Ngoài ra NHCH phải đƣợc
thiết kế sao cho trên đó có thể thực hiện các thao tác loại trừ hoặc thay đổi các CH
“xấu”, bổ xung các CH tốt để số lƣợng và chất lƣợng câu hỏi ngày càng tăng lên. [A4].
Thiết kế một đề kiểm tra tiêu chuẩn hóa và một NHCH là khá phức tạp và tốn nhiều
công sức, trí lực và thời gian. Trong luận văn này, sẽ xem xét việc thiết kế đề kiểm tra
tổng kết môn Toán lớp 12. Có thể tóm tắt các bƣớc đó nhƣ sau:
1) Tên đề thi
2) Mục đích đề thi, đề kiểm tra.
3) Khối lƣợng kiến thức, kĩ năng cần đo lƣờng
4) Đối tƣợng đo lƣờng
5) Những loại hình kiểm tra/ thi thực hiện
6) Mục đích sử dụng kết quả thi
7) Thời gian thi
8) Bảng ma trận trọng số
9) Biên soạn đề
10) Đề thi và đáp án.
Để thực hiện các bƣớc của quy trình trên, chúng ta cần xác định các nội dung
chi tiết của môn học, các mức độ nhận thức mong muốn TS đạt đƣợc rồi từ đó xây
dựng ma trân kiến thức của môn học. Dựa vào các đặc điểm của kì thi, phân bố thời
lƣợng nội dung kiểm tra mà ta phân bố tỉ lệ các CH hợp lí. Việc phân công, chế tác các
CH thi cũng rất quan trọng. Mọi ngƣời đƣợc phân công biên soạn CH phải có năng
lực chuyên môn vững vàng, nắm chắc các ô ma trận kiến thức để biên soạn các CH
một cách chính xác và tốt nhất. Ngoài ra việc phản biện chuyên gia, lập các đề thi thử
với các CH đã đƣợc soạn cũng phải làm hết sức nghiêm túc, khoa học. Những ngƣời
quan tâm đến việc xây dựng một bài kiểm tra phải đối mặt với những khó khăn thử
thách liên quan nhƣ: Đánh giá cái gì, đánh giá nhƣ thế nào, và liệu các test có tin cậy
hay không, có cơ sở vững chắc không. Đó là những thử thách cơ bản đối với ngƣời
giáo viên xây dựng test cho chính mình.
54
Trắc nghiệm tiêu chuẩn hoá thƣờng do các chuyên gia phụ trách chuyên môn
đặc thù soạn thảo, và phải kiểm thử nhiều lần, do đó mỗi câu hỏi trắc nghiệm đƣợc gắn
với các chỉ số cho biết thuộc tính và chất lƣợng của nó nhƣ độ khó, độ phân biệt.
Trong các kiểu câu trắc nghiệm, kiểu câu nhiều lựa chọn có cách trả lời đơn
giản nhất. Câu đúng - sai là một trƣờng hợp riêng của câu nhiều lựa chọn với hai
phƣơng án trả lời. Dễ dàng thấy rằng khi một ngƣời hoàn toàn không có hiểu biết đánh
dấu hú hoạ để trả lời một câu hỏi đúng - sai thì xác suất để anh ta làm đúng là 1/2 hoặc
50%, cũng vậy nếu anh ta đánh dấu hú hoạ để trả lời câu trắc nghiệm với n phƣơng án
trả lời thì xác suất để anh ta làm đúng là 1/n. Trong các kiểu câu trắc nghiệm, kiểu câu
nhiều lựa chọn thƣờng đƣợc sử dụng vì chúng có cấu trúc đơn giản, dễ xây dựng thành
các bài thi, dễ chấm điểm. Về vị trí quan trọng của kiểu câu hỏi NLC nêu dƣới đây
chúng ta sẽ nói kỹ hơn về chúng. Loại câu trắc nghiệm nhiều lựa thƣờng đƣợc dùng
trong các kì thi là loại có bốn phƣơng án trả lời, vì số phƣơng án nhƣ vậy vừa đủ để
giảm xác suất làm đúng do đoán mò hú hoạ xuống còn 25%, đồng thời câu cũng không
quá phức tạp khó xây dựng. Câu trắc nghiệm nhiều lựa chọn cung cấp thông tin cần
thiết hoặc nêu một câu hỏi và các phƣơng án để chọn, và đƣợc đánh dấu bằng các chữ
cái A, B, C, D... hoặc các chữ số 1, 2, 3... trong các phƣơng án để chọn và chỉ có duy
nhất một phƣơng án đúng, các phƣơng án khác đƣợc đƣa vào có tác dụng “gây nhiễu”
(distractor) đối với thí sinh. Nếu câu NLC đƣợc soạn tốt thì một ngƣời không nắm
vững vấn đề sẽ không thể nhận biết đƣợc trong tất cả các phƣơng án để chọn đâu là
phƣơng án đúng, đâu là phƣơng án nhiễu. Một số chuyên gia trắc nghiệm ở phía Nam
còn gọi các phƣơng án nhiễu là “mồi nhử”.
Trong khi soạn thảo câu trắc nghiệm, ngƣời ta thƣờng cố gắng làm cho các
phƣơng án nhiễu đều có vẻ “có lý” và “hấp dẫn” nhƣ phƣơng án đúng. Đôi với tất cả
các môn học ngƣời ta đều có thể viết câu hỏi trắc nghiệm. Tuy nhiên, do đặc thù của
từng môn học mà việc viết trắc nghiệm cho môn này có thể khó hơn cho môn kia. Cần
lƣu ý rằng không phải bất cứ ai có kiến thức chuyên môn cũng viết đƣợc câu trắc
nghiệm có chất lƣợng cao cho chuyên môn đó. Muốn viết câu hỏi trắc nghiệm tốt phải
suy nghĩ sâu sắc về chuyên môn và tích lũy kinh nghiệm sau một thời gian thử nghiệm
lâu dài.
2.2.1. Qui trình xây dựng ngân hàng câu hỏi trắc nghiệm khách quan
55
Nhƣ đã nói ở phần trên, để hoàn thiện các bài trắc nghiệm ngƣời ta phải triển
khai các trắc nghiệm thử. Thử nghiệm các câu hỏi trắc nghiệm nhằm tìm ra các các hỏi
xấu và định cỡ về độ khó cho đề trắc nghiệm. Phép đo này có thể thực hiện đƣợc nhờ
hiệu phép thống kê. Để đo đƣợc năng lực thí sinh, thƣớc đo - bài trắc nghiệm phải
đƣợc định cỡ (calibrration) tỉ mỉ, tức là phải biết đƣợc các độ khó, độ phân biệt của các
câu, độ tin cậy và độ giá trị của bài trắc nghiệm. Tuy chƣa đƣợc định cỡ nhƣ vậy, qua
nhiều bƣớc soạn thảo ngân hàng câu hỏi theo quy trình nhƣ nêu ở phần đầu, bài trắc
nghiệm cũng đã tƣơng đối đảm bảo chất lƣợng để có thể phân loại đƣợc thí sinh.
Những thí sinh nào làm đúng nhiều câu hỏi, họ thuộc nhóm nhóm giỏi, những thí sinh
làm đúng ít câu hỏi, họ thuộc nhóm kém. Nhƣ vậy, dựa vào điểm số của toàn bài trắc
nghiệm nhƣ một thƣớc đo để định cỡ các câu và bài trắc nghiệm.
Cần lƣu ý một điều là khi dùng từ “trắc nghiệm thử” thì chữ “thử” chỉ có ý
nghĩa về chuyên môn trong thiết kế và định cỡ trắc nghiệm, còn trong cuộc sống phải
tạo tình huống để mọi thí sinh để coi lần trắc nghiệm đó là thật, vì có nhƣ vậy thì họ
mới làm nghiêm túc, hết mình và phép thử mới đạt yêu cầu.
Dựa vào kết quả trắc nghiệm thử ngƣời ta có thể tính bằng tay để phân tính bài
các câu và bài trắc nghiệm, cũng có thể nhờ các phần mềm giúp tính rất nhanh chóng
các đại lƣợng cần thiết nhờ các phép tính thống kê tƣơng quan cổ điển, hoặc các phần
mềm đƣợc xây dựng theo các mô hình toán học về đo lƣờng giáo dục. [6]
2.2.2. Quy trình triển khai một kỳ thi trắc nghiệm khách quan
Quy trình tổ chức xây dựng đề và tổ chức kỳ thi trắc nghiệm tiêu chuẩn hoá rất
phức tạp. Có thể tóm tắt các bƣớc của quy trình đó nhƣ sau:
(1) Xác định các môn thi và những nội dung tổng quát cần kiểm tra đối với từng
môn. Đồng thời, định ra yêu cầu về các mức kỹ năng, chẳng hạn: nhớ, hiểu, biết vận
dụng, phân tích, tổng hợp... Để thực hiện bƣớc này ngƣời ta thƣờng lập một ma trận 2
chiều: các dòng phân theo các phần nội dung, các cột phân theo các mức kỹ năng,
trong mỗi ô ghi số câu hỏi cần thiết (hoặc tỷ lệ phần trăm) của phần nội dung và mức
kỹ năng tƣơng ứng.
(2) Phân công cho các giáo viên, viết một số câu trắc nghiệm theo các yêu cầu
cụ thể về nội dung và mức kỹ năng đã xác định theo các bảng, mẫu quy ƣớc.
56
(3) Trao đổi trong từng nhóm biên soạn giúp các tác giả phát hiện và sửa chữa
đƣợc nhiều sai sót mà bản thân không cảm thấy.
(4) Biên tập và đƣa các câu trắc nghiệm vào "ngân hàng" lƣu trong máy tính
theo quy tắc và quy ƣớc sẵn. Ngân hàng câu hỏi thƣờng đƣợc quản lý bằng một phần
mềm chuyên dụng.
(5) Lập đề thi mẫu và tổ chức thử nghiệm trên một mẫu đại diện.
(6) Chấm thi và thống kê, phân tích các kết quả thi thử nhằm xác định độ khó,
độ phân biệt, qua đó có thể đánh giá độ tin cậy của câu hỏi, đề thi trắc nghiệm.
(7) Thay thế, chỉnh sửa các câu hỏi kém chất lƣợng và nhập các câu hỏi chất
lƣợng vào ngân hàng đề thi.
(8) Ra đề thi chính thức: căn cứ vào cấu trúc đề thi (phân bố câu theo nội dung
và mức độ kỹ năng tƣơng ứng bảng ma trân đặc trƣng), nhờ phần mềm tin học để chọn
một cách ngẫu nhiên từ ngân hàng số câu hỏi cần thiết với các đặc trƣng xác định (độ
khó, độ phân biệt, mức kỹ năng) để lập nên một đề thi. Các công cụ phần mềm sẽ giúp
ta xây dựng các đề tƣơng đƣơng một cách đơn, nhẹ nhàng (đảo câu, đảo đáp án,…)
(9) In đề thi và tổ chức thi: đề thi đƣợc in sẵn, phát cho từng thí sinh trong
phòng thi.
(10) Chấm và phân tích thống kê các kết quả thi: ngày nay ngƣời ta có thể chấm
lại trắc nghiệm trên các hệ thống tự động gồm một máy quét quang học và máy tính có
phần mềm tin học hỗ trợ việc chấm thi.
(11) Công bố kết quả thi.
Để xây dựng đƣợc ngân hàng câu hỏi thi phong phú, ta cần lặp đi, lặp lại các
bƣớc ở trên để từ đó liên tục bổ xung các hỏi tốt và loại trừ các câu hỏi xấu, câu hỏi đã
dùng hoặc lỗi thời . Qua đó có thể thấy rằng ngân hàng các câu trắc nghiệm không
phải là kho lƣu trữ bất động mà nhƣ một cơ thể sống, luôn đƣợc bổ sung, loại bỏ, hoàn
thiện và phát triển. [3]
Cần phải nhấn mạnh rằng các câu trắc nghiệm tiêu chuẩn hoá trong ngân hàng
và đề thi trắc nghiệm phải đƣợc bảo mật trƣớc khi đem ra sử dụng. Những đề thi và
57
những câu hỏi đã đƣợc dùng chính thức thƣờng đƣợc công bố ở các tài liệu dùng cho
tham khảo hoặc luyện thi.
Một tác dụng hết sức quan trong của các kỳ thi đại trà bằng trắc nghiệm tiêu
chuẩn hoá là những thông tin thu đƣợc qua việc phân tích thống kế toàn bộ bài làm của
thí sinh qua các kỳ thi là những số liệu hết sức quý báu để đánh giá định lƣợng về tình
hình giáo dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu
thế phát triển của chất lƣợng giáo dục theo thời gian.
2.3. Xây dựng đề thi môn toán
Ngƣời ta có thể áp dụng phƣơng pháp trắc nghiệm để tổ chức thi, kiểm tra ở các
lớp học thông thƣờng với số thi sinh không quá lớn, cũng có thể áp dụng ở các kỳ thi
quy mô lớn hàng nghìn, hàng vạn thí sinh. Trong trƣờng hợp sau, bất kỳ một sơ suất
nhỏ nào cũng có thể dẫn đến những hậu quả xấu và những phản ứng xã hội bất lợi. Do
đó, để triển khai một kỳ thi quy mô lớn ngƣời ta phải chuẩn bị hết sức cẩn thận về đề
thi quy trình thi, thể thức chấm điểm, cách công bố kết quả... Quá trình chuẩn bị đó hết
sức công phu và tốn kém mà một kỳ thi thông thƣờng ở lớp học không thể làm nổi. Ta
có chu trình xây dựng nhƣ sau:
Bảng 2.1 Quy trình xây dựng đề thi
58
Kỳ thi đƣợc chuẩn bị công phu nhƣ vậy đƣợc coi là kỳ thi tiêu chuẩn hoá.
Các câu hỏi trong một đề thi tiêu chuẩn hoá là các câu hỏi đã đƣợc thử nghiệm, định
cỡ trên cơ sở phân tích các tham số độ khó, độ phân biệt, độ tin cậy, độ giá trị của từng
câu.
2.3.1. Chuẩn bị
Để xây dựng đề thi một cách chuẩn mực và khoa học ta cần làm rõ các bƣớc
các vấn đề sau:
(1) Tên đề thi : “ Kiểm tra môn toán học lớp 12”
(2) Mục đích đề thi, đề kiểm tra: “ Đánh giá, kiểm tra kiến thức môn toán lớp
12 của học sinh THPT”
59
(3) Khối lƣợng kiến thức, kĩ năng cần đo lƣờng: “ Toàn bộ chƣơng trình toán 12
theo chuẩn kiến thức, kĩ năng của BGD”
(4) Đối tƣợng đo lƣờng: “ Học sinh học hết chƣơng trình toán 12”
(5) Những loại hình kiểm tra/ thi thực hiện: “Dựa vào các phân tích ở các phần
trên ta chọn hình thức thi trắc nghiệm đa lựa chọn – bốn lựa chọn”
(6) Mục đích sử dụng kết quả thi: Kết quả thi đƣợc sử dụng để xét tốt nghiệp
THPT của thí sinh và tuyển sinh đầu vào cho các trƣờng đại học tại Việt Nam.
(7) Thời gian thi: 90 phút
2.3.2. Xây dựng bảng ma trận trọng số
Để xây dựng bảng ma trận trọng số của đề thi ta dựa vào các tài liệu sau:
(1) Hƣớng dẫn chuẩn kiến thức kĩ năng toán 12 do bộ giáo dục phát hành năm
2006 [9]
(2) Phân phối chƣơng trình chuẩn toán 12 – phụ lục 1.
(3) Dựa vào phân bố thời gian, nội dung kiến thức và mục địch sử dụng kết quả
thi ta xây dựng ma trận trọng số các câu hỏi thi nhƣ sau:
60
Bảng 2.2. Ma trận đề thi môn toán 12
MA TRẬN ĐỀ THI MÔN TOÁN LỚP 12
Mức độ kiến thức đánh giá Tổng số
Vận câu hỏi STT Các chủ đề Nhận Thông Vận dụng biết hiểu dụng cao
1 Hàm số và các bài toán liên 4 4 2 11 1
quan
10 1 4 1 2 Mũ và Lôgarit 4
7 1 3 1 3 Nguyên hàm – Tích phân và 2
ứng dụng
6 0 2 1 4 Số phức 3
5 1 2 1 5 Thể tích khối đa diện 1
3 0 1 1 6 Khối tròn xoay 1
8 1 2 1 7 Phƣơng pháp tọa độ trong 4
không gian
5 19 18 8 50 Số câu
Tổng
38 % 36 % 16 % 10 % Tỷ lệ
Để chuẩn bị cho việc biên soạn câu hỏi ta chuẩn bị bảng đặc tả về nội dung môn
toán lớp 12. Phụ lục 2. Từ đó ta có bảng mô tả mức độ các câu hỏi (mặc định mỗi câu
hỏi 1 điểm ) nhƣ sau:
61
Bảng 2.3 Bảng mô tả chi tiết từng câu hỏi trong đề thi
BẢNG MÔ TẢ CHI TIẾT NỘI DUNG TỪNG CÂU HỎI
CHỦ ĐỀ CÂU MÔ TẢ
Nhận biết: Nhận biết đồ thị của hàm số bậc ba, bậc 4 trùng
phƣơng, hàm số , tƣơng giao giữa các đồ thị đơn
giản.
Nhận biết: Xác định khoảng đồng biến , nghich biến của
hàm số bậc ba, hàm bậc bốn trùng phƣơng thông qua bảng
biến thiên của hàm số.
Nhận biết: Nhận biết cực trị của hàm số bậc ba, bậc bốn
thông qua bảng biến thiên
1. Ứng dụng
Nhận biết: Nhận biết phƣơng trình tiệm cận đứng và ngang đạo hàm để
khảo sát và của đồ thị hàm số
vẽ đồ thị của
hàm số Thông hiểu: Tìm điều kiện của tham số để hàm số đạt cực
(11 câu) trị tại ; số cực trị của hàm số
Thông hiểu: Tìm khoảng đồng biến, nghịch biến của một
hàm số hoặc nhận dạng đồ thị hàm số qua chiều biến thiên
của nó.
Thông hiểu: Tìm GTLN của hàm số trên một đoạn
Thông hiểu: Tìm điều kiện của các tham số để hàm số
đồng biến, nghịch biến trên các khoảng xác định
của nó
62
Vận dụng: Xác định tham số để hàm số bậc ba, bậc bốn
trùng phƣơng có điểm cực trị ,cực đại, cực tiểu thỏa mãn điều
kiện cho trƣớc có liên qua đến khoảng cách, tam giác
Vận dụng: Tìm điều kiện của tham số để hàm số đồng biến,
nghịch biến trên một khoảng hoặc Tìm điều kiện của tham số
đề đồ thị hàm số và đƣờng thẳng cắt nhau tại hai điểm phân
biệt thỏa mãn điều kiện cho trƣớc
Vận dụng cao: Tìm điều kiện của tham số hàm số lƣợng giác
có tham số đồng biến, nghịch biến trên một khoảng hoặc
GTLN-GTNN, ứng dụng thực tế
Nhận biết: Định nghĩa, tính chất của lôgarit. Tính chất của
hàm số lôgarit, đạo hàm của hàm số logarit
Nhận biết: Tính chất của hàm số mũ,đạo hàm của hàm số
mũ,
Nhận biết: Tính chất của hàm số lũy thừa, tập xác định của
hàm số lũy thừa, đạo hàm của hàm số lũy thừa 2. Hàm số
luỹ thừa - Nhận biết: Cách giải phƣơng trình mũ cơ bản, phƣơng trình hàm số mũ lôgarit cơ bản và hàm số
lôgarit Thông hiểu: Giải các phƣơng trình mũ, lôgarit dạng thƣờng
gặp (10 câu)
Thông hiểu: Sử dụng công thức mũ, logarit biến đổi các
biểu thức mũ logarit
Thông hiểu: Giải các bất phƣơng trình mũ , logarit dạng
thƣờng gặp . Tìm tập xác định của hàm số hàm số logarit
Thông hiểu: Đạo hàm, tính chất của hàm số mũ, logarit, lũy
63
thừa dạng hàm hợp. Tập xác định của hàm số hợp của hàm số
lũy thữa
Vận dụng: Phƣơng trình , bất phƣơng trình ,hệ phƣơng trình
mũ chứa tham số, Phƣơng trình, bất phƣơng trình , hệ
phƣơng trình lôgarit chứa tham số
Vận dụng cao: Sử dụng công thức mũ,logarit, tính chất hàm
số mũ, logarit trong các bài toán về tính chất , giá trị lớn nhất
, nhỏ nhất của hàm số hợp của hàm số mũ, hàm số logarit,
Phƣơng trình mũ phức tạp, các ứng dụng thực tế
Nhận biết: Tìm họ nguyên hàm dựa vào bảng nguyên hàm
Nhận biết : Tìm họ nguyên hàm của hàm số dựa vào bảng
nguyên hàm, tính chất nguyên hàm
3. Nguyên Thông hiểu: Tính tích phân của hàm số
hàm - tích Thông hiểu: Tìm một nguyên hàm của hàm số có điều kiện phân và ứng
dụng Thông hiểu: Sử dụng tìm nguyên hàm với các câu hỏi khác
(7 câu) Vận dụng: Tính tích phân , ứng dụng của tích phân
Vận dụng cao: Sử dụng tìm nguyên hàm, tính tích phân của
hàm số với các bài toán liên quan khác. Ứng dụng vào bài
toán thực tế
Nhận biết: Xác định các tham số cơ bản của số phức
Nhận biết: Các phép toán cơ bản với số phức
4. Số phức (6
Nhận biết: Các dạng biểu diễn của số phức câu)
Thông hiểu: Nghiệm phƣơng trình bậc nhất, bậc hai hệ số
thực của số phức.
64
Thông hiểu: Các bài toán liên quan đến môđun, đến tính
toán biểu thức phức
Vận dụng: Các tính toán phức tạp, các bài toán hình học liên
quan đến mô đun số phức.
Nhận biết: Thể tích khối chóp dễ xác định đƣờng cao, diện
tích đáy. Thể tích khối lăng trụ đứng dễ xác định đƣờng cao,
diện tích đáy
Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố
cạnh hoặc góc đơn giản . Tính thể tích khối lăng trụ đứng có
liên quan đến yếu tố cạnh hoặc góc đơn giản
Thông hiểu: Các khái niệm liên quan đến khối đa diện: Mặt,
5. Thể tích cạnh, đỉnh, mặt đối xứng,…, đa diện đều.
khối đa diện Vận dụng: Tính thể tích khối chóp có sử dụng kiến thức ở
(5 câu) mức độ cao hơn về quan hệ vuông góc, góc, khoảng cách để
xác định đƣờng cao, diện tích đáy. Tính thể tích khối lăng trụ
có sử dụng kiến thức ở mức độ cao hơn về quan hệ vuông
góc, góc, khoảng cách để xác định đƣờng cao, diện tích đáy.
Tính thể tích khối lăng trụ, khối hộp xiên
Vận dụng cao: Tính thể tích khối chóp không xác định trực
tiếp phải sử dụng thông qua tỉ số thể tích, phân chia khối đa
diện. Cực trị khối đa diện.
Nhận biết: Công thức thể tích, diện tích liên quan đến khối
nón, khối trụ, khối cầu. 6. Khối tròn
xoay Thông hiểu: Khối nón có liên quan thiết diện. Khối trụ có
liên quan thiết diện (3 câu)
Vận dụng: Xác định tâm và tính bán kính mặt cầu ngoại tiếp
65
khối chóp. Nón, trụ có liên quan đến góc, khoảng cách, thiết
diện. Thể tích khối trụ, diện tích xung quanh ,diện tích toàn
phần hình trụ- Bài toán thực tế.
Nhận biết: Các phép toán về véc tơ, điểm.
Nhận biết: Viết, xác định phƣơng trình mặt phẳng khi biết
một điểm và một vec tơ pháp tuyến
Nhận biết: Viết, xác định phƣơng trình đƣờng thẳng khi biết
một điểm và một vectơ chỉ phƣơng
Nhận biết: Viết phƣơng trình mặt cầu khi biết tâm và bán
kính.
7. Phƣơng Thông hiểu: Các bài toán viết phƣơng trình mặt phẳng, pháp tọa độ đƣờng thẳng cần xác định đƣợc vectơ pháp tuyến hay chỉ trong không phƣơng liên quan điểm các đƣờng thẳng, mặt phẳng đặc gian biệt.(hình chiếu, khoảng cách từ điểm lên các trục Ox, hay
(8 câu) mặt phẳng (Oxy)
Thông hiểu: Các bài toán liên quan đến tƣơng giao, hình
chiếu, khoảng cách của điểm, đƣờng thẳng, mặt phẳng.
Vận dụng: Các bài toán tìm điểm trên mặt phẳng, đƣờng
thẳng,… thỏa mãn các điều kiện cho trƣớc.
Vận dụng cao: Ứng dụng hình giải tích vào hình không gian
hoặc xử lý các bài toán cực trị hình học liên quan đến véc tơ,
điểm, mặt phẳng, mặt cầu, đƣờng thẳng.
66
2.3.3. Biên soạn câu hỏi thi
Để biên soạn câu hỏi thi ta làm theo quy trình sau:
Bảng 2.4. Quy trình biên soạn câu hỏi thi
67
Ta xây dựng từng câu hỏi thi theo quy ƣớc đánh mã từ 1 – 50 cho các loại câu hỏi thi. Khi đó ta biên soạn từng mã câu hỏi thi nhƣ sau:
Mã số 1. KH: HS.A1.STT ( Câu hỏi hàm số mức độ dễ (A) loại 1 gắn với số thứ tự của câu hỏi.
Yêu cầu: Nhận biết: Nhận biết đồ thị của hàm số bậc ba, bậc 4 trùng phƣơng , hàm số , tƣơng giao giữa các đồ thị đơn giản.
Bảng 2.5. Bảng xây dựng câu hỏi thi
TT Nội dung Đáp án Nhiễu 1 Nhiễu 2 Nhiễu 3 Ghi chú
Đƣờng cong trong
hình bên là đồ thị của
một trong bốn hàm số Chú ý: Các
đƣợc liệt kê ở bốn lỗi, bẫy học HS.A1.1
phƣơng án A, B, C, sinh
D. Hỏi hàm số đó là
hàm số nào ?
Hình bên là đồ thị
của hàm số nào HS.A1.2 dƣới đây ?
68
Đƣờng cong
dƣới đây là
đồ thị của HS.A1.3
hàm số nào ?
Đồ thị của hàm số và
đồ thị của hàm số Bốn. Một. Hai. Ba. HS.A1.4
có bao nhiêu
điểm chung ?
Đƣờng cong ở
hình bên là đồ
thị của một
trong bốn hàm HS.A1.5
số ở dƣới
đây. Hàm số đó là hàm số nào ?
69
HS.A1.6 Đƣờng cong ở hình bên là
đồ thị của một trong bốn
hàm số ở dƣới
đây. Hàm số đó là hàm số nào ?
HS.A1.7 Cho hàm số có đồ cắt trục cắt trục cắt trục không cắt thị (C). Mệnh đề nào dƣới đây đúng ? hoành tại một hoành tại hai hoành tại ba trục hoành. điểm. điểm điểm.
…
70
Mã số 36. KH: ĐD.B1.STT ( Câu hỏi khối đa diện mức độ thông hiểu (B) loại 1 gắn với số thứ tự của câu hỏi.
Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố cạnh hoặc góc đơn giản . Tính thể tích khối lăng trụ đứng có liên quan đến
yếu tố cạnh hoặc góc đơn giản
TT Nội dung Đáp án Nhiễu 1 Nhiễu 2 Nhiễu 3 Ghi chú
Cho khối chóp tam giác đều S.ABC có cạnh đáy bằng a
và cạnh bên bằng 2a. Tính thể tích V của khối chóp ĐD.B1.1
S.ABC.
Cho hình chóp tứ giác đều có cạnh đáy bằng
ĐD.B1.2 cạnh bên bằng Tính thể tích V của khối chóp đã
cho.
Cho khối chóp S.ABCD có đáy là hình vuông cạnh a, SA
vuông góc với (ABCD) và SC tạo với mặt phẳng (ABC) ĐD.B1.3
một góc . Tính thể tích V của khối chóp đã cho.
71
Hình chóp S.ABC có đáy là tam giác ABC đều cạnh a.
Hình chiếu vuông góc của S trên mặt phẳng (ABC) là ĐD.B1.4 trung điểm H của cạnh AB, cạnh bên SC tạo với đáy một
góc . Thể tích khối chóp S.ABC là
Cho hình lăng trụ có thể tích bằng 12 và
đáy ABCD là hình vuông tâm O. Tính thể tích khối chóp ĐD.B1.5
.
ĐD.B1.6 Cho hình chóp có đáy là tam giác vuông
cân tại B với biết vuông góc với (ABC) và
hợp với đáy một góc 60o. Thể tích khối chóp là:
ĐD.B1.7 Cho hình lăng trụ , có
, cạnh bên hợp với mặt
phẳng đáy một góc . Biết hình chiếu vuông góc của
trên trùng với trọng tâm của tam giác .
Thể tích của khối đa diện tính theo bằng .
72
73
74
2.4. Thử nghiệm đề thi
Quá trình thử nghiệm đƣợc diễn ra sau khi hoàn thiện công tác xây dựng đề
thi. Quá trình thử nghiệm cần in ấn đề thi và phiếu trả lời theo mẫu chuẩn giúp quá
trình nhập dữ liệu đƣợc đơn giản.
2.4.1. Chọn mẫu nghiên cứu
Mẫu HS đƣợc chọn là học sinh lớp 12, đã hoàn thành chƣơng trình toán 12.
Dựa trên điều kiện thực tế của tác giả, số lƣợng HS đƣợc chọn khoảng 200 HS với
bốn đề đã đƣợc xây dựng. Bốn đề đƣợc thử nghiệm cùng nhau (chia làm 4 mã đề
001, 002, 003, 004) với mỗi mẫu. Các học sinh đƣợc chọn thử nghiệm là các nhóm
HS ở lớp 12A4 Xuân đỉnh - 40hs (Hà Nội), 12A1 Vinschool - 35HS, 12A1 CVP -
35HS (Vĩnh Phúc ), 12B6 Trần Hƣng Đạo – 45HS, 12A8 Xuân Trƣờng - 45HS
(Nam Định)
2.4.2. Kế hoạch thực hiện
Để đảm bảo tính nghiêm túc, và tính tin cậy, đề thử nghiệm đƣợc thực hiện
trong khoảng thời gian từ 10 – 4 – 2017 đến ngày 25 – 4 – 2017. Đây là thời gian
các HS đã hoàn thành chƣơng lớp 12, nhƣng chƣa thi hết học kì. Điều này là quan
trọng, bởi kết quả bài thi cần phản ánh chính xác năng lực của TS tham gia dự thi.
Một khó khăn trong quá trình lấy mẫu là thời gian lấy mẫu chỉ diễn ra trong một
khảng thời gian rất ngắn (2 tuần), ngoài khoảng thời gian này, kết quả lấy mẫu
không cho kết quả tốt. Kết quả thử nghiệm ban đầu có các câu hỏi tự luận và các
câu hỏi trả lời ngắn. Nhƣng do hình thức thi trung học quốc gia thay đổi, nên thái độ
làm bài của TS không tốt, dẫn đến kết quả thu đƣợc không đạt yêu cầu. Do đó phân
tích câu hỏi thi đa phân đã không thực hiện đƣợc. Đây là một điều hết sức đáng tiếc.
Bởi phân tích các câu hỏi đa phân là một ƣu điểm của lý thuyết IRT mà trong CTT
không có.
2.4.3. Kết quả thử nghiệm.
Sau quá trình trình biên soạn câu hỏi thi theo mẫu phụ lục 4 ta đƣợc 4 mã đề
thi: Đề số 1, đề số 2, đề số 3, đề số 4 (các câu hỏi trong các đề thi có thể trùng
75
nhau). Thứ tự các câu hỏi trong mỗi đề thi đƣợc trộn đánh số từ 1 – 50. Nhƣng để
thuận tiện cho việc phân tích chỉ số các câu hỏi chúng ta sẽ sắp xếp lại theo bảng
mô tả chỉ tiết từng câu hỏi. Kết quả kiểm tra thu đƣợc lƣu trong file excel với mỗi
đề thi, kết quả thử nghiệm đƣợc lƣu theo định dạng sau.
Bảng 2.6. Mẫu lưu kết quả câu hỏi thi
STT Câu 1 Câu 2 Câu 3 … Câu 49 Câu 50
ĐA B A D A C B
Hs.1 B A B A D A
Hs.2 C B C B A D
Hs.3 B C C D A D
…
Hs.N A D D A C B
Hs.(N+1) B D A B C D
Cột 1. Là số thứ tự tƣơng ứng của TS đƣợc kiểm tra. Dòng 2 lƣu đáp án của đề thi.
Từ dòng 3 trở đi là số thứ tự tƣơng ứng với số báo danh của TS.
Từ cột 2 – 51 là tƣơng ứng với 50 câu hỏi thi tƣơng ứng bảng đặc tả kiến thức của
từng câu theo phụ lục 4.
Trong tất cả các đề thử nghiệm câu n luôn tƣơng đƣơng nhau về mặt kiến thức, kĩ
76
năng.
CHƢƠNG 3
KẾT QUẢ NGHIÊN CỨU
3.1. Giới thiệu
Ứng dụng lý thuyết vào IRT vào xây dựng phân tích câu hỏi thi, đề thi là một
vấn đề không đơn giản. Những năm 70, dù cơ sở lý thuyết về IRT đã tƣơng đối
hoàn thiện nhƣng việc ứng dụng IRT vào IRT gặp khó khăn bởi các tính toán phức
tạp. Thời gian gần đây, cùng với việc phát triển của công nghệ thông tin, các phần
mềm chuyên dụng giúp cho việc ƣớc lƣợng tham số câu hỏi thi, định chuẩn đề thi,
so bằng đề thi, cũng nhƣ phân tích câu hỏi thi nhị phân, đa phân và đa chiều đồng
thời ƣớc lƣợng chính xác năng lực của thí sinh trở nên phổ biến hơn. Các phần mềm
về IRT có thể kể ra nhƣ BILOG, MULTILOG, WINSTEPS, IRTPRO, MPLUS,
QUEST, CONQUEST và HLM. Phần lớn chúng là các phần mềm thƣơng mại đắt
tiền và không dễ sử dụng. Dù vậy một số gói IRT đã đƣợc phát triển trong phần
mềm mã nguồn mở R để ƣớc tính các mô hình IRT khác nhau cũng xuất hiện và đã
đƣợc đón nhận nhƣ TAM. Bao gồm các gói ltm cho IRT không giới hạn
((Rizopoulos, 2006), eRm cho các mô hình Rasch mở rộng (Mair & Hatzinger,
2007), mlirt cho đánh giá đa cấp và Bayesian của một số mô hình IRT (Fox, 2007),
gpcm (Johnson, 2007) cho một dự toán Bayesian của mô hình tín dụng một phần
tổng quát, MCMCpack cho Bayesian
Trong luận văn này tác giả sử dụng phần mềm Conquest, đây là phần mềm
do nhóm tác giả Margaret L.Wu, Raymond J.Adams, Mar R.Wilson, Samuel
A.Haldane ở Australian Council for Educational Research phát triển. Đây là một
phần mềm rất mạnh với nhiều tính năng và hƣớng dẫn chi tiết cụ thể. Tuy nhiên bản
phần mềm tác giả nhận đƣợc dùng để phần tích là bản phần mềm sử dụng dòng lệnh
để viết lệnh điều khiển (command), không có giao diện trực quan để thao tác nhƣ đa
số các phần mềm thƣơng mại khác. Điều này cũng là một cản trở trong việc phổ cập
77
IRT vào cộng đồng. Bởi các khái niệm, các tham số trong IRT của IRT đã quá phức
tạp. Nên việc sử dụng Conquest phân tích các tham số đề thi mất khá nhiều thời
gian.
3.2. Phân tích tham số câu hỏi thi
Quá trình biên soạn câu hỏi thi, ta xây dựng đƣợc 4 đề thi thử nghiệm, cùng một hệ
thống các câu hỏi thi tƣơng đƣơng theo mô tả ở bảng 2.3 . Kết quả thử nghiệm đƣợc
lƣu vào các file excel rồi từ đó chuyển dữ liệu theo định dạng trong file chạy
(Ex1.cqc) để lƣu vào file Ex1.dat. Ta sử dựng dữ liệu thô đó để phân tích các câu
hỏi thử nghiệm và đề thi thử nghiệm bẳng phần mềm ConQuest.
Các file: Ex1.dat, Ex1.cqc,. ex1.lab
Phân tích đề thi 01. Với mẫu thu đƣợc các file: ex1.int, ex1.shw.
Đề Toán: Có 4 đề Toán, mỗi đề có 50 câu hỏi (CH) và một đề tự luận ngắn
gồm 25 câu hỏi với thành phần CH, bao gồm đƣợc soạn từ 7 chủ đề của môn toán
lớp 12 ( Ứng dụng đạo hàm, hàm số mũ và logarit, Nguyên hàm, tích phân và ứng
dụng, Số phức, Khối đa diện, Khối tròn xoay và Hình giải tích trong không gian)
theo tỷ lệ các câu hỏi, mức đó khó trong bảng ma trận đặc trƣng của đề thi. Vì vấn
đề chọn mẫu vào cuối năm học 2016 – 2017. Bộ giáo dục đã thay đổi hình thức thì
từ tự luận sang trắc nghiệm, nên quá trình lấy mẫu các câu hỏi tự luận đã không đạt
kết quả tốt. Do vậy mẫu tự luận phải loại bỏ (do học sinh không làm hết khả năng,
không nghiêm túc khi làm bài). Với các câu hỏi nhị phân (0-1) - dichotomous đã
lựa chọn ta cũng có thể tái tạo đƣợc dữ liệu đa phân – polytomous. Tuy nhiên việc
tái tạo này không cần thiết, vì mục đích của chúng ta ở đây là tập chung phân các
tham số của từng câu hỏi trong từng đề thi, để từ có đánh giá chất lƣợng thực tế của
câu hỏi trên mẫu đã triển khai (vì vậy mẫu lựa chọn không tốt, độ giá trị của câu hỏi
không có). Tiếp theo ta minh họa chi tiết cách phân tích các tham số đặc trƣng của
các câu hỏi trong đề 1 (các đề khác ta làm tƣơng tự).
Khi chạy chƣơng Conquest, nó sẽ sinh ra các file kết quả trong đó file *.int
để lấy số liệu phân tích câu hỏi theo CTT, ngƣợc lại file *. Shw dùng số liệu để
78
phân tích câu hỏi theo IRT.
3.2.1. Phân tích câu hỏi thi bằng CTT
Để phân tích một đề thi theo lý thuyết đánh giá cổ điển ta cần quan tâm đến
các tham số sau: Độ khó của câu hỏi thi, Các khả năng nhầm đáp án, Chất lƣợng
của các phƣơng án sai (mồi nhử), Độ phân biệt của câu hỏi thi, Hệ số tƣơng quan
giữa điểm của câu hỏi thi với điểm toàn bài, Độ tin cậy của đề thi
Nhƣ ta đã biết với các câu hỏi : 1, 2, 3, …, 50 ta cần thống kê lại các tham số
nhƣ bảng vẽ .
Bảng 3.1 Độ khó P của một câu hỏi trắc nghiệm số 1.
Phƣơng án trả lời A B C D* Bỏ sót Tổng
Số lƣợng 7 2 18 24 0 51
Độ khó P (%) 13.73 3.92 35.29 47.06
Ghi chú: * ký hiệu phƣơng án trả lời đúng.
item:1 (CAU_01)
Cases for this item 51 Discrimination 0.36
Item Threshold(s): -1.13 Weighted MNSQ 0.97
Item Delta(s): -1.13
------------------------------------------------------------------------------
Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1
------------------------------------------------------------------------------
A 0.00 7 13.73 -0.23 -1.69(.098) -1.49 0.21
B 0.00 2 3.92 0.12 0.81(.422) -1.10 0.18
C 0.00 18 35.29 -0.26 -1.88(.067) -1.35 0.34
D 1.00 24 47.06 0.36 2.74(.008) -1.12 0.41
===========================================================
Ta sẽ xem thông số của từng câu hỏi.
Với câu hỏi 1. Độ khó : p = 47,06%, Độ phân biệt D =0.36
Tƣơng tự với các câu hỏi khác ta cũng thống kê lại các tham số đặc trƣng của
câu hỏi để từ đó quyết định loại bỏ, chỉnh sửa hay cập nhật một câu hỏi nào đó vào
ngân hàng đề thi. Tuy nhiên việc định chuẩn, so bằng giữa các câu hỏi thi, các đề thi
79
thƣờng gặp khó khăn, vì không có cơ sở logic để so bằng giữa các đề tƣơng đƣơng.
3.2.2. Phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại
Việc phân tích câu hỏi thi bằng lý thuyết đánh giá hiện đại cũng có thể đƣa ra
những thông tin thống kê để phân tích câu hỏi thi bằng lý thuyết đánh giá cổ điển.
Tuy nhiên, việc phân tích câu hỏi thi bằng lý thuyết đánh giá hiện đại (sử dụng phần
mềm CONQUEST và các phần mềm chuyên dụng khác) còn có thể giúp có đƣợc
những thông tin dƣới đây:
a) Sự phù hợp của câu hỏi thi
Sự phù hợp của các câu hỏi thi thể hiện các câu hỏi thi cùng đo một đại
lƣợng có tên gọi là INFIT MNSQ, nằm trong khoảng 0.70 đến 1.30 theo [5]. Nếu
có một câu hỏi nào có INFIT MNSQ nằm ngoài khoảng trên cần bị loại bỏ. Xem ví
dụ minh hoạ:
------------------------------------------------------------------------------------------
VARIABLES UNWEIGHTED FIT WEIGHTED FIT
--------------- ----------------------- -----------------------
item ESTIMATE ERROR^ MNSQ CI T MNSQ CI T
------------------------------------------------------------------------------------------
1 CAU_01 -0.179 0.242 1.09 ( 0.61, 1.39) 0.5 1.09 ( 0.66, 1.34) 0.6
2 CAU_02 -2.053 0.297 1.01 ( 0.61, 1.39) 0.1 0.97 ( 0.03, 1.97) 0.1
3 CAU_03 -1.461 0.279 0.87 ( 0.61, 1.39) -0.6 0.93 ( 0.31, 1.69) -0.1
4 CAU_04 -2.045 0.297 0.35 ( 0.61, 1.39) -4.4 0.84 ( 0.04, 1.96) -0.2
5 CAU_05 0.789 0.229 0.95 ( 0.60, 1.40) -0.2 0.97 ( 0.78, 1.22) -0.3
6 CAU_06 -0.175 0.242 0.90 ( 0.61, 1.39) -0.5 0.97 ( 0.66, 1.34) -0.1
7 CAU_07 -0.425 0.248 1.03 ( 0.61, 1.39) 0.2 1.00 ( 0.61, 1.39) 0.0
8 CAU_08 1.699 0.231 1.32 ( 0.61, 1.39) 1.5 1.21 ( 0.78, 1.22) 1.8
9 CAU_09 0.268 0.234 1.35 ( 0.61, 1.39) 1.6 1.33 ( 0.73, 1.27) 2.2
10 CAU_10 0.470 0.231 0.98 ( 0.61, 1.39) -0.1 1.01 ( 0.75, 1.25) 0.1
11 CAU_11 1.612 0.233 1.50 ( 0.60, 1.40) 2.2 1.17 ( 0.78, 1.22) 1.4
12 CAU_12 -2.031 0.296 0.99 ( 0.61, 1.39) 0.0 1.01 ( 0.04, 1.96) 0.2
13 CAU_13 0.665 0.229 1.21 ( 0.61, 1.39) 1.0 1.16 ( 0.77, 1.23) 1.3
14 CAU_14 0.270 0.234 0.88 ( 0.61, 1.39) -0.5 0.92 ( 0.73, 1.27) -0.6
15 CAU_15 -2.027 0.296 0.94 ( 0.61, 1.39) -0.2 1.00 ( 0.05, 1.95) 0.2
80
Bảng 3.2 Bảng tham số các hỏi thi về mức độ phù hợp
16 CAU_16 -0.228 0.245 1.08 ( 0.60, 1.40) 0.4 0.94 ( 0.64, 1.36) -0.3
17 CAU_17 -1.225 0.272 0.46 ( 0.61, 1.39) -3.3 0.79 ( 0.39, 1.61) -0.7
18 CAU_18 -0.170 0.242 0.73 ( 0.61, 1.39) -1.4 0.80 ( 0.66, 1.34) -1.2
19 CAU_19 -0.556 0.252 0.79 ( 0.61, 1.39) -1.0 0.88 ( 0.58, 1.42) -0.5
20 CAU_20 0.948 0.227 1.14 ( 0.61, 1.39) 0.8 1.11 ( 0.79, 1.21) 1.0
21 CAU_21 1.916 0.237 1.56 ( 0.60, 1.40) 2.4 1.30 ( 0.74, 1.26) 2.1
22 CAU_22 -0.702 0.256 0.91 ( 0.61, 1.39) -0.4 0.95 ( 0.55, 1.45) -0.2
23 CAU_23 0.373 0.232 0.90 ( 0.61, 1.39) -0.4 0.93 ( 0.74, 1.26) -0.5
24 CAU_24 0.570 0.230 1.07 ( 0.61, 1.39) 0.4 1.09 ( 0.76, 1.24) 0.8
25 CAU_25 -0.843 0.261 0.43 ( 0.60, 1.40) -3.5 0.67 ( 0.51, 1.49) -1.4
26 CAU_26 -0.860 0.261 1.07 ( 0.61, 1.39) 0.4 0.89 ( 0.51, 1.49) -0.4
27 CAU_27 1.717 0.237 1.18 ( 0.59, 1.41) 0.9 1.03 ( 0.76, 1.24) 0.3
28 CAU_28 1.226 0.227 0.92 ( 0.61, 1.39) -0.4 0.94 ( 0.80, 1.20) -0.6
29 CAU_29 -2.474 0.308 0.61 ( 0.61, 1.39) -2.2 0.98 ( 0.00, 2.22) 0.2
30 CAU_30 -3.216 0.322 0.51 ( 0.61, 1.39) -3.0 0.98 ( 0.00, 2.83) 0.3
31 CAU_31 -2.503 0.309 0.38 ( 0.61, 1.39) -4.1 0.92 ( 0.00, 2.24) 0.1
32 CAU_32 -0.568 0.252 0.83 ( 0.61, 1.39) -0.9 0.88 ( 0.58, 1.42) -0.5
33 CAU_33 0.262 0.234 0.99 ( 0.61, 1.39) 0.0 1.03 ( 0.73, 1.27) 0.2
34 CAU_34 0.522 0.233 1.03 ( 0.60, 1.40) 0.2 1.01 ( 0.75, 1.25) 0.1
35 CAU_35 0.752 0.228 0.82 ( 0.61, 1.39) -0.9 0.85 ( 0.78, 1.22) -1.3
36 CAU_36 2.239 0.244 1.14 ( 0.60, 1.40) 0.7 1.08 ( 0.68, 1.32) 0.5
37 CAU_37 -0.064 0.240 1.37 ( 0.61, 1.39) 1.7 1.10 ( 0.68, 1.32) 0.7
38 CAU_38 1.634 0.235 1.03 ( 0.59, 1.41) 0.2 1.00 ( 0.77, 1.23) 0.0
39 CAU_39 2.727 0.260 1.86 ( 0.59, 1.41) 3.4 1.18 ( 0.54, 1.46) 0.8
40 CAU_40 -0.304 0.245 0.72 ( 0.61, 1.39) -1.5 0.80 ( 0.63, 1.37) -1.1
41 CAU_41 0.363 0.232 0.77 ( 0.61, 1.39) -1.2 0.82 ( 0.74, 1.26) -1.4
42 CAU_42 1.092 0.235 1.39 ( 0.58, 1.42) 1.7 1.27 ( 0.79, 1.21) 2.3
43 CAU_43 -2.064 0.297 0.47 ( 0.61, 1.39) -3.3 0.89 ( 0.03, 1.97) -0.1
44 CAU_44 -2.063 0.297 0.66 ( 0.61, 1.39) -1.8 0.97 ( 0.03, 1.97) 0.1
45 CAU_45 -0.433 0.249 0.71 ( 0.61, 1.39) -1.5 0.87 ( 0.61, 1.39) -0.6
46 CAU_46 -0.432 0.249 0.78 ( 0.61, 1.39) -1.1 0.79 ( 0.61, 1.39) -1.1
47 CAU_47 0.364 0.232 0.95 ( 0.61, 1.39) -0.2 0.97 ( 0.74, 1.26) -0.2
48 CAU_48 2.986 0.265 0.92 ( 0.60, 1.40) -0.3 0.95 ( 0.47, 1.53) -0.1
49 CAU_49 1.908 0.237 1.23 ( 0.60, 1.40) 1.1 1.10 ( 0.74, 1.26) 0.8
50 CAU_50 1.728* 1.781 1.26 ( 0.58, 1.42) 1.2 1.10 ( 0.76, 1.24) 0.8
81
Dựa vào bảng số liệu trong file ex1.shw mà ta thấy các câu hỏi 4, 11, 17, 21,
30, 39 là những câu cần phải loại bỏ vì nó nằm ngoài vùng năng lực của thí sinh (có
thể nó quá dễ hoặc quá khó với thí sinh). Hay nói một cách khác câu hỏi thi không
tìm đƣợc mô hình, hàm đặc trƣng. Quá trình ƣớc lƣợng tham số của câu hỏi không
thành công.
Chúng ta xem xét các hàm đặc trƣng của các câu hỏi để thấy đƣợc việc ƣớc
lƣợng tham số (độ khó) cho các câu hỏi thƣờng khó khăn, trong nhiều trƣờng hợp là
không ƣớc lƣợng đƣợc bởi sai số giữa hàm đặc câu hỏi trƣng quan sát, và đặc trƣng
câu hỏi tính toán là quá lớn. Chúng ta xem xét một số câu dự định loại bỏ ở trên.
Câu số 4.
Hình 3.1 Đồ thị hàm đặc trưng câu hỏi số 4.
Câu số 21.
82
Hình 3.2 Đồ thị hàm đặc trưng câu hỏi số 21.
Câu 39.
Hình 3.3 Đồ thị hàm đặc trưng câu hỏi số 39.
Các câu 4, 21, 39 ở trên đều là những câu rất khó ƣớc lƣợng đƣợc tham số câu hỏi, bởi các đáp ứng của TS với CH là rời rạc và khó hội tụ. Do vậy hàm đặc trƣng câu hỏi không tính đƣợc các tham số của câu hỏi (quá trình ƣớc lƣợng không hội tụ). Nhìn trên các hình vẽ chúng ta thấy đƣờng chấm xanh không bám sát vào các đƣờng liền xanh.
Trong khi đó đƣờng cong quan sát của câu hỏi và đƣờng cong tính toán của
câu hỏi 40 là có xu hƣớng hội tụ.
83
Hình 3.4 Đồ thị hàm đặc trưng câu hỏi số 40.
+item --------------------------------------------------------------------------------------- | | | | | | 4 | | | | | | | | | | | | | | | | | | 3 |48 | XXXX| | |39 | XX| | XX| | XXXXXXXXX| | XX| | XXXXXXXXXXXXXXX|36 | XXXXX| | 2 XXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXX|21 49 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|8 27 50 | XXXXXXXXX|11 38 | XXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|28 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|42 | 1 XXXXXXXXXXXXXXXXXX|20 | XXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX|5 35 | XXXXXXXXXXXXXXXX|13 24 | XXXXXXXXXXXXX|10 34 | XXXXXXXXXXX|23 41 47 | XXXXXXXXXXXXX|9 14 33 | XXXXX| | 0 XXXXXXX| | XXXXXXXXXXXXXXX|37 | XXXXX|1 6 18 | XXXXX|16 40 | XXXXXXXXXXX|7 45 46 | XXXXXXXXXXXXX|19 | XX|32 | XXXXX|22 | XXXX|25 26 | -1 XXXXX| | | | |17 | | | XX|3 | | | | | | | | | -2 |12 15 | |2 4 43 44 | | | |29 30 31 | ======================================================================================= Each 'X' represents 0.1 cases
b) Sơ đồ phân bố độ khó câu hỏi thi và năng lực thí sinh
84
Hình 3.5 Bản đồ phân bố độ khó câu hỏi thi và năng lực thí sinh
Bản đồ phân bố độ khó câu hỏi thi và năng lực thí sinh cho thấy mức độ phù
hợp của đề thí đối với thí sinh dự thi. Có thể là đề thi quá dễ, quá khó hoặc rất phù
hợp. Bản đồ phân bố cho thấy đề thi đo đƣợc hầu hết năng lực của thí sinh hay còn
có những khoảng trống cần bổ sung một số câu hỏi để đo và phân biệt đƣợc năng
lực của các thí sinh ở đó. Ở hình minh họa 2.6 đề thi này là dễ so với năng lực của
thí sinh. Các câu hỏi ở mức độ trung bình còn ít, cần bổ xung. Các câu hỏi 12, 15, 2,
4, 43, 44, 29, 30, 31 là rất dễ so với năng lực của tập thí sinh đang kiểm tra. Vì vậy
ta phải soạn lại các câu hỏi này nhằm tăng độ khó của câu hỏi. Chúng ta hoàn toàn
có thể lấy các câu hỏi 12, 15, 2, 4, 43, 44, 29, 30, 31 từ các đề tƣơng đƣơng 02, 03,
04 rồi tính toán lại các tham số đặc trƣng (đƣờng cong đặc trƣng) của đề thi và hàm
thông tin của đề thi.
c) Đƣờng cong đặc trƣng của đề thi
Dựa vào kết quả chạy của phần mềm Conquest ta dễ dàng có tham số đặc
trƣng (độ khó b) của từng câu hỏi. ví dụ từ bảng 2.8 câu hỏi 1 có độ khó b = -0.18
nên hàm đặc trƣng của câu hỏi 40 có dạng và đồ thị của
nó là hình 2.5. Một cách khác để xác định độ khó của câu hỏi (Item) là dựa vào
đƣờng cong đặc trƣng câu hỏi. Nếu thì độ khó câu hỏi .
Để giúp ích cho việc so bằng điểm cũng nhƣ chuẩn hóa đề thi, việc tính toán
đƣờng cong đặc trƣng cho cả đề thi là hết sức cần thiết. Thực ra việc tính toán
đƣờng cong đặc trƣng cho đề thi là việc cộng gộp tất cả các đƣờng cong đặc trƣng
của từng câu hỏi thi. Dựa vào đƣờng cong đặc trƣng của đề thi, ứng với thi sinh có
năng lực là thì ta hoàn toàn có thể ƣớc lƣợng đƣợc điểm của thí sinh đó. Đồng
thời dựa vào hàm đặc trƣng của đề thi chúng ta sẽ biết đề thi nào khó hoặc dễ hơn
85
với các nhóm học sinh có năng lực khác nhau.
Hình 3.6 Đường cong đặc trưng của đề thi số 1.
Nhận xét: dựa vào đƣờng cong đặc trƣng của từng câu hỏi thi chúng ta dễ
dàng tính đƣợc độ khó, độ phân biệt của các câu hỏi thi, đề thi theo lý thuyết IRT.
d) Hàm thông tin của đề thi.
Hàm thông tin của đề đƣợc tính bằng tổng các hàm thông tin của câu hỏi thi.
Dựa vào thông tin của đề thi ta hoàn toàn tính đƣợc sai số tiêu chuẩn của đề thi bới
công thức: .
Lord [3] đã đề xuất một quy trình sử dụng các hàm thông tin để thiết kế các
ĐTN đáp ứng bất kì yêu cầu mong muốn nào của đặc trƣng ĐTN. Quy trình này
dựa trên có sẵn một ngân hàng ĐTN và các câu hỏi đã đƣợc ƣớc lƣợng tham số theo
IRT.
Các bƣớc quy trình đƣợc đề nghị nhƣ sau:
(1) Quyết định về hình dáng muốn có của hàm thông tin. Lord gọi đó là hàm
thông tin mục tiêu.
(2) Chọn các CH từ ngân hàng đề có hàm thông tin CH sẽ phủ kín các vùng
năng lực của hàm thông tin mục tiêu.
(3) Sau mỗi CH đƣợc đƣa vào ĐTN, tính hàm thông tin của ĐTN bào gồm
86
các CH đã lựa chọn.
(4) Tiếp tục thay thế và lựa chọn các CH để đƣa vào ĐTN cho đến khi hàm
thông tin của ĐTN tiệm cận với hàm thông tin mục tiêu ở mức độ chấp nhận đƣợc.
Hình 3.7 Hàm thông tin của đề thi số 1.
87
Hình 3.8 Hàm thông tin của đề thi số 2.
Hình 3.9 Hàm thông tin của đề thi số 3.
Hình 3.10 Hàm thông tin của đề thi số 4.
Việc so sánh hai hàm thông tin đƣợc thực hiện bằng cách tính hiệu suất tỷ
đối của một ĐTN so với một ĐTN khác [3]. . Trong đó là
88
hiệu suất tỷ đối và , là các hàm thông tin tƣơng ứng của ĐTN A và B.
3.2.3. Phân tích câu hỏi thi đa chiều
Theo [3], các TS sử dụng nhiều năng lực tri thức để ứng đáp trắc nghiệm,
nhƣng có một số năng lực liên quan đến nhiệm vụ trắc nghiệm, một số không. Số
chiều năng lực cần cho mô hình phân tích dữ liệu phụ thuộc vào số chiều và mức độ
năng lực (nhận thức) của TS. Với tập dữ liệu đã lấy mẫu ta xác định rõ các chiều
năng lực (khả năng của thí sinh khi làm các vấn đề - chiều hƣớng năng lực của TS)
của TS thông qua việc ứng đáp các phần của toán 12: Giải tích (Ứng dựng đạo hàm,
nguyên hàm tích phân), Đại số (Hàm số mũ, logarti và số phức) và Hình học (khối
đa diện, khối tròn xoay và hình giải tích trong không gian).
Ta dựa vào file chạy của ƣớc lƣợng tham số của câu hỏi khi nó là các câu hỏi
đa chiều, coi các chiều năng lực toán học của mỗi TS lớp 12 là: Giải tích, Đại số và
Hình học. Đây là mỗi chiều năng lực của từng TS. Qua phân tích này chúng ta sẽ rút
ra các đánh giá tƣơng tác về các năng lực (Giải tích, Đại số, Hình học) của TS về đề
thi thông qua bảng 3.3
Nhìn chung đề kiểm tra đã cho dễ so với mức năng lực, một số câu dễ quá
cần phải sửa, thay thế cho phù hợp chung với đề. Trong ba chiều năng lực (Giải
tích, đại số, hình học) thì năng lực đại số của TS là tốt nhất, năng lực hình học của
TS là thấp nhất. Nhƣng 3 chiều năng lực này không quá chênh lệch nhau. Về cơ bản
đề thi ra đạt yêu cầu các phần kiến thức toán học (giải tích, đại số, hình học) trong
đề thi không quá khác biết về mức độ khó dễ. Cụ thể ta xét các chiều năng lực riêng
89
rẽ sau:
Bảng 3.3 Phân tích đa chiều năng lực của TS với đề thi 01. Dimension Terms in the Model (excl Step terms) --------------------------------------- Giaitich Daiso Hinhhoc +item -------------------------------------------------------------------------------------- 4 | | | | | | | | | | | | | X| | | | | | | | | | | | XXX| | | 3 | XX| | | | XXX| | | X| XXXX| |21 | | XXXX| | | X| XXXXXX| |48 | XX| XXXXXXXX| | | XXX| XXXXX| |39 | 2 XXXXX|XXXXXXXXXXXX| | | XXXX| XXXXXXXX| X| | XXXXXXXXXX| XXXXX| XX|8 20 27 | XXXXXXX| XXXXXXX| |11 36 | XXXXXX| XXXXXXX| XXXXX|13 | XXXXXXXXXXXX| XXXX| XXXXX|28 34 49 | XXXXXXXXXX| XXX| XXXXXX|50 | 1 XXXXXX| XX| XXXXXX|14 33 38 | XXX| XXX| XXXXXXXX|5 | XXXXX| XX| XXXXXXXXX| | XXXXXX| XX| XXXXXXXX|10 18 24 | X| XXXXXXXXXXXXXXX|16 23 42 | XXXX| XX| XXXXXXX|9 | XXX| XX| XXX|19 32 35 | 0 XXX| XXXX| XXXX| | XX| XX| XXXX|1 6 | XX| X| XXX|7 41 47 | XX| X| XXX| | XXX| | XX|17 22 | X| | X|25 37 | -1 X| | XX|26 40 | | | XXX|45 46 | | | XXX| | | | X|12 | | | XXX|3 15 | | | | | | | X|31 | -2 | | |29 | | | |2 4 | | | | | | | | | | | |30 | | | |43 44 | -3 | | | | ====================================================================================== Each 'X' represents 0.5 cases .
90
Dimension Terms in the Model (excl Step terms) ------------- Giaitich +item ------------------------------------------------------------ 3 | | | | X| | | | X| | XX| | XXX| | 2 XXXXX| | XXXX| | XXXXXXXXXX|8 27 | XXXXXXX|11 | XXXXXX| | XXXXXXXXXXXX|28 | XXXXXXXXXX| | 1 XXXXXX| | XXX|5 | XXXXX| | XXXXXX|10 24 | X|23 | XXXX|9 | XXX| | 0 XXX| | XX|1 6 | XX|7 | XX| | XXX|22 | X|25 | -1 X|26 | | | | | | | |3 | | | | | -2 | | |2 4 | | | | | | | | | | | -3 | | | | ============================================================ Each 'X' represents 0.5 cases ============================================================
1. Năng lực Giải tích.
Hình 3. 11. Năng lực giải tích của TS
Mức độ câu hỏi dƣới mức năng lực của thí sinh, đặc biệt các 2,3,4 là quá dễ.
Thiếu các câu có độ khó trung bình.
91
Dimension Terms in the Model (excl Step terms) ------------- Daiso +item ------------------------------------------------------------ 4 | | | | | | X| | | | | | XXX| | 3 XX| | XXX| | XXXX|21 | XXXX| | XXXXXX| | XXXXXXXX| | XXXXX| | 2 XXXXXXXXXXXX| | XXXXXXXX| | XXXXX|20 | XXXXXXX| | XXXXXXX|13 | XXXX|34 | XXX| | 1 XX|14 33 | XXX| | XX| | XX|18 | XX|16 | XX| | XX|19 32 | 0 XXXX| | XX| | X| | X| | |17 | | | -1 | | | | | | |12 | |15 | | | |31 | -2 |29 | | | | | | | |30 | | | | | -3 | | | | ============================================================ Each 'X' represents 0.5 cases ============================================================
2. Năng lực đại số
Hình 3. 12. Năng lực đại số của TS
Mức độ câu hỏi dƣới mức năng lực của thí sinh, đặc biệt các 12,15,17 là quá dễ. So với năng lực ứng đáp các câu hỏi phần giải tích, năng lực ứng đáp câu hỏi phần đại số của mẫu TS tốt hơn. Thiếu các câu có độ khó cao để phân loại tốt thí sinh.
92
Dimension Terms in the Model (excl Step terms) ------------- Hinhhoc +item ------------------------------------------------------------ 3 | | | | | | | | |48 | | | |39 | 2 | | X| | XX| | |36 | XXXXX| | XXXXX|49 | XXXXXX|50 | 1 XXXXXX|38 | XXXXXXXX| | XXXXXXXXX| | XXXXXXXX| | XXXXXXXXXXXXX|42 | XXXXXXX| | XXX|35 | 0 XXXX| | XXXX| | XXX|41 47 | XXX| | XX| | X|37 | -1 XX|40 | XXX|45 46 | XXX| | X| | XXX| | | | X| | -2 | | | | | | | | | | |43 44 | | | -3 | | | | ============================================================ Each 'X' represents 0.5 cases
3. Năng lực hình học
Hình 3. 13. Năng lực hình học của TS
Đề thi phù hợp với năng lực của thí sinh. Nhƣng cần chỉnh sữa câu 43 hoặc 44 để tăng độ khó của câu hỏi.
93
3.2.4. Phân tích câu hỏi thi đa phân
Việc phân tích các các câu hỏi (TN) nhiều lựa chọn ngoài hai trạng thái 0 -1
(đúng sai), ta hoàn toàn có thể phân tích các câu hỏi tự luận nhiều trang thái (mức
điểm (0-1-2-3),… Giải sử với mỗi ý trong câu TL làm đúng thí sinh đƣợc 1 điểm.
Với mỗi câu TL có 3 ý nhỏ. Thì mức điểm phân bố cho một thí sinh bất kì luôn là 0
– 1 – 2 – 3. Có hàng loạt mô hình đƣợc đề xuất để phân tích câu hỏi đa phân,
nhƣng tổng quát nhất có lẽ là mô hình định giá từng phần (Partial Credit Model –
PCM) của Master, G.N. Có thể nói mô hình đa phân là trƣờng hợp tổng quát của
mô hình nhị phân hay các mô hình nhị phân chúng ta vừa phân tích ở trên là một
trƣờng hợp riêng của mô hình đa phân. Đây là một mô hình rất hay để phân tích các
câu hỏi thi theo hình thức tự luận. Từ đó có thể thiết kết một đề thi gồm cả các câu
hỏi TL lẫn TN nhằm phát huy hết ƣu điểm của từng loại câu hỏi thi. Tuy nhiên do
việc thay đổi hình thức thi THPT QG năm vừa qua (2017) dẫn đến việc thu thập số
liệu về các câu hỏi thi tự luận đã không thành công. (Học sinh không làm bài một
cách nghiêm túc). Đó là một điều hết sức đáng tiếc. Việc này mặc dù không ảnh đến
quá trình nghiên cứu của luận văn, nhƣng việc thiếu số liệu minh họa các câu hỏi đa
phân chất lƣợng dẫn đến các khuyến nghị ƣu nhƣợc điểm giữa hai hình thức thi phổ
biến hiện nay là TNKQ và TL và cách kết hợp giữa hai hình thức thi này để kết hợp
các ƣu điểm giữa hai loại hình thi này vẫn chỉ mang tính lý thuyết mặc dù cơ sở lý
thuyết đã đƣợc phân tích kĩ càng. Tác giả hy vọng rằng trong thời gian tới sẽ có
những nghiên cứu với các số liệu tin cậy để đánh giá về mô hình câu hỏi đa phân.
3.3. Một số kết quả phân tích câu hỏi thi.
3.3.1. Quy trình hiệu chuẩn đề kiểm tra
Các thủ tục đƣợc sử dụng để hiệu chuẩn một bài kiểm tra đã đƣợc đề xuất
bởi Birnbaum vào năm 1968 và đã đƣợc thực hiện trong các chƣơng trình máy tính
đƣợc sử dụng rộng rãi nhƣ BICAL (Wright và Mead, 1976) và LOGIST
(Wingersky, Barton và Chúa, 1982). Mô hình Birnbaum là một thủ tục lặp đi lặp lại
sử dụng hai giai đoạn đánh giá khả năng tối đa. Trong một giai đoạn, các tham số
của N câu hỏi trong đề thử nghiệm đƣợc ƣớc tính, và trong giai đoạn thứ hai, các
tham số năng lực của thử nghiệm M ngƣời đƣợc ƣớc tính. Hai giai đoạn đƣợc thực
94
hiện lặp đi lặp lại cho đến khi tập hợp các tham số thu đƣợc ƣớc tính ổn định. Tại
thời điểm này, bài kiểm tra đã đƣợc hiệu chuẩn và chỉ số về khả năng đƣợc xác
định. Trong giai đoạn đầu tiên của mô hình Birnbaum, ƣợc lƣợng năng lực của mỗi
thí sinh là đƣợc đối xử thể hiện bằng số liệu thật của đặc tính tiềm ẩn. Sau đó, các
thông số của mỗi câu hỏi trong bài kiểm tra đƣợc ƣớc lƣợng thông qua thủ tục xác
suất tối đa. Việc này đƣợc thực hiện cho từng câu hỏi tại một thời gian, bởi vì một
giả thiết cơ bản là các câu hỏi này độc lập với nhau. Kết quả là thu đƣợc một bộ các
giá trị cho các ƣớc lƣợng của các tham số của câu hỏi trong bài kiểm tra.
Giai đoạn thứ hai giả định rằng các ƣớc lƣợng tham số câu hỏi sản sinh ra
trong giai đoạn đầu tiên là thực sự là giá trị của các tham số các câu hỏi (quá trình
ƣớc lƣợng tham số câu hỏi là chuẩn xác). Sau đó, khả năng của mỗi ngƣời thí sinh
đƣợc ƣớc tính bằng thuật toán thủ tục tối đa. Giả định rằng khả năng của từng thí
sinh là độc lập với tất cả các thí sinh khác. Do đó tại một thời điểm, năng lực của thí
sinh luôn đƣợc ƣớc lƣợng. Quá trình giai đoạn hai đƣợc lặp lại cho đến khi một số
tiêu chí hội tụ phù hợp đƣợc đáp ứng. Hiệu quả tổng thể là các tham số của N câu
hỏi đƣợc thử nghiệm với các mức độ năng lực khác nhau của M ngƣời thử nghiệm
đƣợc thực hiện cùng một lúc. Với quá trình này, nhằm giảm các tính toán quá phức
tạp của nó ngƣời ta thƣờng sử dụng các phần mêm chuyên dụng, đặc thù (free hoặc
thƣơng mại) để ƣớc lƣợng bộ tham số câu hỏi cho đề thi đƣợc chuẩn hóa. Cũng bởi
điều này mà lý thuyết IRT ở Việt Nam chƣa thực sự đƣợc ứng dụng. Bởi các khó
khăn về mặt tính toán cũng nhƣ sử dụng các phần mềm chuyên dụng.
3.3.2 . Các đặc trưng về các đề thử nghiệm
Mặc dù là các đề đƣợc làm độc lập nhau, nhƣng trong quá trình phân tích ta
thấy mức độ đáp ứng của đề thi với các mẫu thí TS là tƣơng đối giống nhau đều
trong khoảng năng lực từ -3 đến 3 là chủ yếu.
95
Đề 1 +item --------------------------------------------------------------------------------- | | 3 |48 | XXXX| | |39 | XX| | XX| | XXXXXXXXX| | XX| | XXXXXXXXXXXXXXX|36 | XXXXX| | 2 XXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXX|21 49 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|8 27 50 | XXXXXXXXX|11 38 | XXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|28 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|42 | 1 XXXXXXXXXXXXXXXXXX|20 | XXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX|5 35 | XXXXXXXXXXXXXXXX|13 24 | XXXXXXXXXXXXX|10 34 | XXXXXXXXXXX|23 41 47 | XXXXXXXXXXXXX|9 14 33 | XXXXX| | 0 XXXXXXX| | XXXXXXXXXXXXXXX|37 | XXXXX|1 6 18 | XXXXX|16 40 | XXXXXXXXXXX|7 45 46 | XXXXXXXXXXXXX|19 | XX|32 | XXXXX|22 | XXXX|25 26 | -1 XXXXX| | | | |17 | | | XX|3 | | | | | | | | | -2 |12 15 | |2 4 43 44 | | | |29 30 31 | ================================================================================= Each 'X' represents 0.1 cases
Hình 3. 14. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 01
96
Đề 2. +item --------------------------------------------------------------------------------------- 6 | | | | | | | | | | XXXXXX| | 5 XXX| | | | XXX| | | | XXXXXX| | 4 | | | | XXXXXXXXXXXX| | XXXXXXXXX|50 | XXXXXXXXX| | XXXXXXXXX| | 3 XXX|16 | XXX|21 | XXX| | XXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX| | 2 XXXXXXXXX|39 | XXXXXXXXX|8 25 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|41 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|32 44 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|9 11 | XXXXXXXXXXXXXXXXXXXXXX|35 40 | 1 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|34 48 | XXXXXXXXXXXXXXXXXX|3 14 42 47 | XXXXXXXXXXXX|28 37 | XXXXXXXXXXXX| | 0 XXXXXXXXX|2 33 38 | XXXXXXXXX|1 | XXXXXXXXX|12 19 | XXXXXX|10 24 | XXXXXX|5 46 | -1 XXXXXX|26 49 | |6 7 18 23 27 36 | XXX| | | | |13 45 | | | -2 | | | | |4 20 22 29 43 | | | | | -3 | | ======================================================================================= Each 'X' represents 0.1 cases
Hình 3. 15. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 02
97
Đề 3 +item --------------------------------------------------------------------------------------- 4 | | XXXXXXXX| | | | |9 | | | | | | | XXXXX| | 3 | | | | |14 | | | XXX| | XXX| | XXXXXXXX|39 | XXXXXXXX| | 2 |42 | XXXXX| | XXXXXXXXXXXXX| | XXXXXXXXXXXXX|32 | XXXXXXXXXXXXXXXX|28 | XXXXXXXXXXXXXXXXXXXXX|10 25 | XXXXXXXXXXXXXXXXXXXXX|16 34 50 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX|21 | 1 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|8 | XXXXXXXXXXXXXXXXXXXXXXXX|38 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|17 26 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|11 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|46 48 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|24 35 36 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|7 27 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX|15 | 0 XXXXXXXXXXXXXXXXXXX|1 2 49 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|18 41 | XXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXX|20 40 44 | XXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXX|22 | XXXXX|13 | XXXXXXXXXXXXX|5 47 | -1 XXXXXXXX|4 | XXXXX|30 | XXXXX|6 37 45 | | | | | |3 19 | | | | | -2 | | | | |23 29 43 | | | | | |12 | |31 33 | | | -3 | | ======================================================================================= Each 'X' represents 0.1 cases
Hình 3. 16. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 03
98
Đề 4. +item --------------------------------------------------------------------------------------- | | 3 | | |30 37 43 45 46 | XXXXXXXXXXX|3 4 12 15 16 29 48 | | | | | | | 2 | | | | | | | | |47 | |9 24 | 1 | | | | | | |5 23 | |11 | |14 19 38 | 0 |17 25 39 | |2 21 | |20 | |7 | XX|26 28 34 42 49 | XXXX|31 33 | -1 XXXXXXX|18 50 | XXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|27 36 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX|10 32 | XXXXXXXXXXXXXXXXXX|8 | -2 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|40 | XXXXXXXXXXXXXXXXXXXXXXXX|6 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX| | XXXXXXX|41 | XXXXXXXXXXX|22 | -3 XXXX| | XXXXXXX|1 | XX| | | | | | XXXX| | -4 |44 | | | | | |13 | | | | | -5 | | ======================================================================================= Each 'X' represents 0.1 cases =======================================================================================
Hình 3. 17. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 04
Ta có thể ngay các đề thi gần nhƣ tƣơng đồng nhau, các đề thi này đều dễ so với năng lực của thí sinh. Do vậy công tác hiệu chỉnh các câu hỏi thi sẽ dễ dàng.
99
KẾT LUẬN, GỢI Ý GIẢI PHÁP VÀ KHUYẾN NGHỊ
1. Kết luận
Việc xây dựng một đề thi theo lý thuyết đo lƣờng hiện đại (IRT) hiện không
còn quá mới mẻ trên thế giới. Tuy nhiên ở Việt Nam có khá ít các nhóm nghiên cứu
sâu về lĩnh vực này. Các tài liệu tiếng Việt về lý thuyết đo lƣờng hiện đại chủ yếu
do tác giả Lâm Quang Thiệp viết và xuất bản, các tài liệu tiếng Anh hiện nay chủ
yếu là các Workshop (hội thảo) hoặc các sách hàn lâm của các tác giả Lord,
Baunman, Rash,…. Do vậy việc xây dựng, phân tích một đề thi theo lý thuyết IRT
của tác giả gặp khá nhiều khó khăn. Mặc dù vậy luận văn này đã giới thiệu, hệ
thống một cách sơ lƣợc quy trình xây dựng, phân tích và đánh giá một đề thi theo lý
thuyết IRT. Các bƣớc thực hiện xây dựng và phân tích, chuẩn hóa một đề thi. Từ đó
biết cách chọn lọc, nhận định chất lƣợng các câu hỏi thi cũng nhƣ mức độ khó dễ
của một đề thi nào đó nhằm nâng cao chất lƣợng đề thi. Thông qua việc xây dựng
và phân tích đề thi môn toán lớp 12 bằng lý thuyết đánh giá hiện đại, chúng ta thấy
các ƣu điểm của IRT. Đó là việc phân tích các tham số của câu hỏi thi không phụ
thuộc với các mẫu đƣợc chọn, các câu hỏi thi trong một đề cũng độc lập với nhau và
đƣợc ƣớc lƣợng các tham số (độ khó, độ phân biệt) một cách chủ động. Việc phân
tích đề thi vơi các câu hỏi nhị phân, đa phân và đa chiều giúp chất lƣợng đề thi đƣợc
nâng cao, công bằng, khách quan trong đánh giá và đặc biệt nhận biết đƣợc chất
lƣợng giáo dục tổng thể qua các năm đi lên hay đi xuống để từ đó giúp nhà quản lý
các quyết định, điều chỉnh chính sách hợp lý.
Qua đây, ta có thể áp dụng quy trình xây dựng, phân tích đề thi vào các đơn
vị trƣờng học riêng biệt hoặc các cụm trƣờng. Từ đó cải tiến, nâng dần chất lƣợng
kiểm tra đánh giá ở các cơ sở đào tạo giáo dục, giúp các kì kiểm tra đánh giá định kì
nghiêm túc, khách quan, phản ánh đúng chất lƣợng giáo dục. Đặc biệt trong giai
đoạn hiện nay việc tổ chức các kì thi quốc gia đã chuyển dần sang hình thức TN.
Việc nhìn nhận các chiều năng lực riêng biệt của TS cũng là một vấn đề hết sức mới
mẻ. Qua việc phân tích các mối tƣơng quan giữa các chiều năng lực (Giải tích, Đại
số, Hình học) của TS giúp cho ta có cái nhìn rõ ràng về các năng lực của các nhóm
TS cụ thể. Từ đó bài kiểm tra có tính chất phân hóa, phân loại TS tốt hơn.
100
2. Một số gợi ý giải pháp và khuyến nghị
Do năng lực và thời gian có hạn, luận văn chƣa phân tích chi tiết cơ sở lý
thuyết của IRT cũng nhƣ các ứng dụng cụ thể của nó. Đặc biệt là hai quá trình ƣớc
lƣợng tham số câu hỏi thi và quá trình định chuẩn đề thi. Tác giả cũng mong rằng
trong thời gian tới có nhiều đề tài về lĩnh vực này cũng nhƣ có nhiều chuyên gia
trong nƣớc, cũng nhƣ các chuyên gia ngƣời Việt ở nƣớc ngoài tham gia viết các
cuốn sách tham khảo một cách cụ thể, cặn kẽ để IRT đƣợc phổ biến trong cộng
đồng giáo viên, cũng nhƣ có một cộng đồng riêng nghiên cứu sâu về lý thuyết này.
Một trong những khó khăn khi tác giả thực hiện đề tài này lựa chọn các phần
mềm chuyên dụng trong phân tích các câu hỏi thi. Bởi ở hiện nay trên thế giới có
hai xu hƣớng (trƣờng phái) nghiên cứu về IRT. Đó là các trung tâm nghiên cứu ở
Hoa Kỳ - đông đảo nhất và nhóm nghiên cứu của Úc cùng các nƣớc Châu Á Thái
Bình Dƣơng. Các nhóm nghiên cứu ở Hoa Kỳ có cộng đồng rất đông và có nhiều tài
liệu và phần mềm thƣơng mại dùng cho IRT phổ biến trên Internet. Nhóm thứ hai là
ở Úc, có cộng đồng rất nhỏ bé và quen thuộc với chúng ta hơn với bản phần mềm
ConQuest đã đƣợc phổ cập ở Việt Nam. Tuy nhiên tài liệu về Conquest rất ít và khó
dùng. Conquest đã đƣợc nhúng vào các tool về thống kê mã nguồn mở trong R,
TAM. Nên tác giả rất mong có một phần mềm chuyên về phân tích IRT bằng tiếng
Việt để giúp cho việc phân tích đánh giá câu hỏi thi, đề thi trực quan và dễ dàng
hơn.
Việc phân tích các ƣu nhƣợc điểm của hai hình thức thi TN và TL vẫn chƣa
đƣợc phân tích bằng các số liệu cụ thể là một điều đáng tiếc. Tác giả cũng hy vọng
trong thời gian tới các đề tài nhƣ trên sẽ tiếp tục đƣợc nghiên cứu, thực hiện bởi các
đề tài khác để cộng đồng nghiên cứu và làm việc với IRT ngày càng đông lên, nắm
bắt tốt hơn về nền tảng lý thuyết cũng nhƣ ứng dụng của lý thuyết đo lƣờng hiện
đại. Để việc áp dụng lý thuyết IRT vào quá trình phân tích, xây dựng, đánh giá đề
thi đƣợc phổ biến và thƣờng xuyên.
101
TÀI LIỆU THAM KHẢO
1. Lâm Quang Thiệp (2008), Trắc nghiệm và ứng dụng. Nhà xuất bản KHKT.
2. Lâm Quang Thiệp (2012), Đo lường và đánh giá hoạt động học tập trong nhà
trường. Nhà xuất bản sƣ phạm.
3. Lâm Quang Thiệp (2011), Đo lường trong giáo dục – Lý thuyết và ứng dụng.
Nhà xuất bản ĐH QGHN.
4. Dƣơng Thiệu Tống (1995), Trắc nghiệm và đo lường thành quả học tập. Nhà
xuất bản TP HCM.
5. Dƣơng Thiệu Tống (1995), Thống kê ứng dụng trong nghiên cứu khoa học giáo
dục. Nhà xuất bản khoa học xã hội.
6. Phạm Xuân Thanh (2013), Tập bài giảng đo lường. Ebook.
7. Trần Khánh Đức (2013), Tập bài giảng đo lường và đánh giá trong giáo dục.
Ebook.
8. Bộ giáo dục (2014), Sách giáo khoa toán THPT. Nhà xuất bản giáo dục.
9. Bộ giáo dục (2010), Chuẩn kiến thức kĩ năng toán THPT. Nhà xuất bản giáo dục.
10. Frank_B._Baker (2001), Item Response Theory. Published by the ERIC
11. Ronald_K._Hambleton (2012), Fundamentals of Item Response. Springer
12. Christine DeMars (2011), Item Response Theory, Oxford University Press, Inc
13. Lord Frederic (2009), Applications of item response theory to practical testing
problems. Routledge.
14. Dr._Remo_Ostini (2006), Dr._Michael, L._Nering, POLYTOMOUS ITEM
RESPONSE THEORY MODELS. Sage Publications, Inc.
15. Mark_D._Reckase (2009), Multidimensional Item Response Theory. Springer
16. Russell_Waugh (2010), Applications of Rasch Measurement. Nova Science, Inc.
17. By Dr. V. Natarajan (2009), Basic Principles of IRT . Ebook.
18. Margaret L. Wu Ray mond J. Adams (2007), ACER ConQuest, Version 2.0.
ACER Press
Guilford Press
19. R. J. de Ayala (2009), The Theory and Practice of Item Response Theory. The
102
20. Frank B. Baker, Seock-Ho Kim (2017), The Basics of Item Response Theory
Using R. Spring.
103
Bảng phụ lục 1: Phân phối chƣơng trình toán Lớp 12
Cả năm 123 tiết Đại số và Giải tích 78 tiết Hình học 45 tiết
Học kì I: 19 tuần (72 tiết) 48 tiết 24 tiết
Học kì II: 18 tuần (51 tiết) 30 tiết 21 tiết
TT Nội dung
Số tiết Ghi chú
Ứng dụng đạo hàm để khảo sát và vẽ đồ thị của hàm số:
Sự đồng biến, nghịch biến của hàm số. Cực trị của hàm số.
1
Giá trị lớn nhất và giá trị nhỏ nhất của hàm số. Đƣờng
20
Đại số 78
tiệm cận đứng, đƣờng tiệm cận ngang của đồ thị hàm số.
tiết
Khảo sát sự biến thiên và vẽ đồ thị của hàm số
(trong đó có
Hàm số luỹ thừa, hàm số mũ và hàm số lôgarit: Luỹ
16 tiết ôn
thừa. Hàm số luỹ thừa. Lôgarit. Hàm số mũ. Hàm số
2
17
tập, KT, trả
lôgarit. Phƣơng trình mũ và phƣơng trình lôgarit. Bất
bài và tổng
phƣơng trình mũ và lôgarit
ôn thi tốt
Nguyên hàm, Tích phân và ứng dụng: Nguyên hàm. Tích
nghiệp)
3
16
phân. Ứng dụng của tích phân trong hình học.
Số phức: Số phức. Cộng, trừ và nhân số phức. Phép chia
4
9
số phức. Phƣơng trình bậc hai với hệ số thực
Khối đa diện: Khái niệm về khối đa diện. Khối đa diện lồi
Hình học 45
5
và khối đa diện đều. Khái niệm về thể tích của khối đa
11
tiết
diện
(trong đó có
Mặt nón, mặt trụ, mặt cầu: Khái niệm về mặt tròn xoay.
6 tiết ôn
6
10
Mặt cầu
tập, KT, trả
bài và tổng
PP toạ độ trong không gian: Hệ toạ độ trong không gian.
ôn thi tốt
7
Phƣơng trình mặt phẳng. Phƣơng trình đƣờng thẳng trong
18
nghiệp)
không gian.
104
105
Phụ lục 2: Mẫu đặc tả kiến thức môn toán 12 theo chuẩn kiến thức kĩ năng bộ giáo dục ban hành.
Chủ đề 1. Ứng dụng đạo hàm
TT Nội dung Mức độ
Yêu cầu
Dạng câu hỏi
Chú ý
1. Khái niệm hàm đơn điệu (nắm vững khái niệm, các phản ví
- Nắm vững khái niệm
dụ)
- Nhận dạng đồ thị của hàm đơn điệu
2. Nhìn dạng đồ thị để biết hàm đơn điệu trên khoảng nào (Các
- Biết đƣợc mỗi liên hệ giữa dấu đạo
hàm thƣờng gặp hàm bậc 2, bậc 3,bậc 4 trùng phƣơng, phân
hàm với tính đơn điệu của đồ thị hàm
thức,…).
Nhận biết
số.
3. Hiểu đƣợc tính liên quan giữa dấu đạo hàm và tính đơn điệu
- Tìm khoảng đơn điệu của hàm số đơn
Tính đơn
của hàm số.
giản (đa thức, phân thức)
1
điệu của
4. Tìm khoảng đơn điệu của hàm số đơn giản (đa thức, phân thức
hàm số
đơn giản, lƣu ý các lỗi dễ sai – dấu đạo hàm bằng 0 rời rạc)
- Tìm khoảng đơn điệu của hàm số phức
1. Tìm khoảng đơn điệu của các hàm phức tạp (Lƣợng giác, dấu
tạp (căn thức, lƣợng giác, hàm chứa dấu
|.|, căn thức)
Thông
|.|, hàm phân thức phức tạp)
hiểu
2. Dấu hiệu nhận biết nhanh tính đơn điệu của một số hàm
- Nhận xét tính đơn điệu của một số
thƣờng gặp (hàm bậc 3, bậc 4 trùng phƣơng, bậc 1/bậc 1,…).
hàm cơ bản
106
3.
- Tìm điều kiện của tham số để hàm số
1. Tìm m để hàm số đơn điệu trên khoảng.
Kĩ thuật
đơn điệu trên các khoảng cho trƣớc,
2. Tìm m để hàm số đơn điệu trên khoảng có độ dài bằng
hỏi để
Vận dụng
- Vận dụng tính đơn điệu trong đại số
tránh bấm
thấp
3. Tìm nghiệm của phƣơng trình.
(giải phƣơng trình, hệ phƣơng trình,
máy tính
4. Lồng ghép khái niệm đơn điệu với các bài toán khác.
min max,…)
1. Ứng dụng tính đơn điệu đặc trƣng của các hàm thƣờng gặp
Vận dụng
- Các bài toán thực tiễn.
2. Ứng dụng tính đơn điệu trong các bài toán so sánh, bất đẳng
cao
thức.
TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý
1. Tìm cực trị của hàm số đơn giản: hàm bậc 3,bậc 4, bậc Nắm vững khái niệm cực trị hàm số 2,.. Nhận biết hàm số, hình dáng đồ thi của hàm số Cực trị 2. Dựa bảng biến thiên để tìm cực trị 2 hàm số
Thông Biết cách tìm cực trị của hàm thƣờng 1. Tìm cực trị của các hàm phức tạp: chứa dấu |.|, căn
hiểu gặp thức,…
107
Nhận biết số cực trị qua dấu đạo
hàm. 1. Điều kiện để hàm số có cực trị, không có cực trị Vận dụng
thấp Điều kiện để hàm số cực trị, không 2. Biện luận số cực trị của hàm số
có cực trị
Giải các bài toán liên quan đến cực 1. Cực trị liên quan đến hàm bậc 3 Vận dụng trị hàm số đặc biệt hàm bậc 3, bậc 4 cao 2. Cực trị liên quan đến hàm bậc 4 trùng phƣơng
TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý
Nhận biết Khái niệm GTLN, GLNN 1. Từ BBT kết luận GTLN, GTNN của hàm số
Thông Tìm GTLN, GTNN của hàm số bằng 1. Biết tìm GTLN, GTNN của hàm số thƣờng gặp hiểu đạo hàm GTLN, 3 1. Tìm GTLN,GTNN của các hàm phức tạp (đổi ẩn, biến GTNN Tìm GTLN, GTNN của hàm số phức
đổi) về các hàm đơn giản Vận dụng tạp (đổi biến),
thấp 2. Tìm điều kiện để phƣơng trình, bpt có nghiệm, vô Ứng dụng bài toán tìm GTLN,
nghiệm, một nghiệm,… GTNN trong các bài toán biện luận
108
nghiệm phƣơng trình
1. Tìm GTLN, GTNN của các hàm nhiều biến Ứng dụng GTLN, GTNN trong các Vận dụng 2. Tìm GTLN, GTNN của các phức hợp: chứa nhiều loại bài toán bất đẳng thức, cực trị hàm cao hàm, biểu thức phức tạp, các bài toán ứng dụng trong sản nhiều biến xuất, hình học.
TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý
Khái niệm tiệm cận đứng, tiệm cận Nhận biết 1. Định nghĩa TCĐ, TCN ngang
1. Tìm TCĐ, TCN của đồ thị các hàm cơ bản Thông Tìm TCĐ, TCN của hàm số hiểu 2. Tính số TC của đồ thị hàm số
4 Tiệm Cận
Giải các bài liên quan đến đƣờng TC 1. Biện luận số tiệm cận của đồ thị hàm số Vận dụng Tìm điều kiện để đồ thị hàm số có thấp 2. Giải quyết các bài toán có yếu tố tiệm cận tiệm cận
Vận dụng
109
cao
TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý
Khảo sát và vẽ đồ thị hàm số các 1. Nhận dạng đồ thi của các hàm thƣờng gặp: Hàm bậc 3, hàm thƣờng gặp bậc 4 trùng phƣơng, hàm phân thức bậc 1/bậc 1. Nhận biết Điều kiện để một điểm thuộc đồ thị 2. Nhận biết một điểm có nằm trên đồ thị hàm số một hàm số
Thông Nhận dạng hình dáng đồ thị các hàm 1. Phán đoán đồ thị của các hàm phức tạp có dựa vào các
Đồ thị hiểu thƣờng gặp tính chất của hàm số: tính đơn điệu, tính cực trị,… 5 hàm số
Các bài toán liên quan đền đồ thị: Vận dụng Biện luận số nghiệm, bài toán tiếp 1. Biện luận số nghiệm của hàm số thấp tuyến,…
1. Các bài toán sự tƣơng giao Vận dụng Các bài toán về tƣờng giao đồ thị,… cao 2. Các bài toán tổng hợp về đồ thị hàm số
110
Phụ lục 3: Định dạng biên soạn câu hỏi thi.
Mã số 36. KH: ĐD.B1.STT ( Câu hỏi khối đa diện mức độ thông hiểu (B) loại 1 gắn với số thứ tự của câu hỏi.
Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố cạnh hoặc góc đơn giản . Tính thể tích khối lăng trụ đứng có liên quan đến
yếu tố cạnh hoặc góc đơn giản
TT
Nội dung
Đáp án
Nhiễu 1
Nhiễu 2
Nhiễu 3
Ghi chú
Cho khối chóp tam giác đều S.ABC có cạnh
Chóp
tam đều,
đáy bằng a và cạnh bên bằng 2a. Tính thể
cho cạnh bên
ĐD.B1.1
tích V của khối chóp S.ABC.
Chóp tứ giác đều
Cho hình chóp tứ giác đều
có
cho cạnh bên
ĐD.B1.2
cạnh đáy bằng
cạnh bên bằng
Tính
thể tích V của khối chóp đã cho.
Cho khối chóp S.ABCD có đáy là hình
Cho tứ giác cho
vuông cạnh a, SA vuông góc với đáy và SC
đƣờng cao, góc
ĐD.B1.3
giữa cạnh bên mặt
tạo với mặt phẳng (ABC) một góc
. Tính
đáy
thể tích V của khối chóp đã cho.
….
111
Phụ lục 4. Đặc tả nội dung kiến thức từng câu hỏi theo ma trận trọng số trong đề thi.
CHỦ ĐỀ CÂU
MÔ TẢ
Đề 4 Đề 3 Đề 2 Đề 1
Nhận biết: Nhận biết đồ thị của hàm số bậc ba, bậc 4 trùng phƣơng , hàm số
, tƣơng
6
3
1
1
1
giao giữa các đồ thị đơn giản.
Nhận biết: Xác định khoảng đồng biến , nghich biến của hàm số bậc ba, hàm bậc bốn trùng
25
7
6
5
2
phƣơng thông qua bảng biến thiên của hàm số. Tƣơng giao giữa các đồ thị đơn giản.
Nhận biết: Nhận biết cực trị của hàm số bậc ba, bậc bốn thông qua bảng biến thiên. Số cực trị
1. Ứng
27
4
27
7
3
của các hàm bậc 3, bậc 4.
dụng đạo
hàm
để
Nhận biết: Nhận biết đồ thị có tiệm cận đứng và ngang của đồ thị hàm số
15
8
9
2
4
khảo
sát
Thông hiểu: Tìm điều kiện của tham số để hàm số đạt cực trị tại
; số cực trị của hàm số, số
và vẽ đồ
12
18
30
22
5
cực trị của hàm số của hàm số chứa tham số. Nhận dạng hàm số qua tính chất của BBT.
thị
của
Thông hiểu: Tìm khoảng đồng biến, nghịch biến của một hàm số với các hàm phức tạp hoặc
hàm số
14
14
15
13
6
nhận dạng đồ thị hàm số qua chiều biến thiên của nó.
(11 câu)
Thông hiểu: Tìm GTLN của hàm số trên một đoạn, tiệm cận của hàm số chứa mẫu thức phức tạp
18
28
12
27
7
.
Thông hiểu:Biện luận số nghiệm của phƣơng trình. Xác định tham số để hàm số bậc ba, bậc bốn
34
35
37
16
8
trùng phƣơng có điểm cực trị ,cực đại, cực tiểu, cực trị hàm chứa dấu |.|
Vận dụng: Xác định tham số để hàm số bậc ba, bậc bốn trùng phƣơng có điểm cực trị, cực đại,
35
34
34
33
9
112
cực tiểu thỏa mãn điều kiện cho trƣớc có liên qua đến khoảng cách, tam giác. Cực trị biểu thức
hai biến đơn giản hoặc một biến phức tạp. Các bài toán liên quan đến tham số về tính đồ thị hàm
số.
Vận dụng: Tìm điều kiện của tham số để hàm số đồng biến, nghịch biến trên một khoảng hoặc
Tìm điều kiện của tham số đề đồ thị hàm số và đƣờng thẳng cắt nhau tại điểm phân biệt thỏa mãn
43
43
32
42
10
điều kiện cho trƣớc. Định dạng của các đồ thị phức tạp.
Vận dụng cao: Tìm điều kiện của tham số hàm số lƣợng giác có tham số đồng biến, nghịch biến
trên một khoảng, biện luận tính chất đồ thị dựa vào dấu đạo hàm hoặc các bài toán ứng dụng thực
46
47
50
44
11
tế
Nhận biết: Định nghĩa, tính chất của lôgarit. Tính chất của hàm số lôgarit, đạo hàm của hàm số
8
5
17
6
12
logarit
Nhận biết: Tính chất của hàm số mũ,đạo hàm của hàm số mũ,
4
12
29
3
2. Hàm số
13
Nhận biết: Tính chất của hàm số lũy thừa, tập xác định của hàm số lũy thừa, đạo hàm của hàm
luỹ thừa -
9
21
39
20
14
số lũy thừa
hàm
số
Nhận biết: Cách giải phƣơng trình mũ cơ bản, phƣơng trình lôgarit cơ bản. Các phép biến đổi
mũ
và
1
13
8
18
15
hàm lũy thừa.
hàm
số
lôgarit
Thông hiểu: Giải các phƣơng trình mũ, lôgarit dạng thƣờng gặp, Tính toán biến đổi biểu thức
30
27
31
38
16
(10 câu)
logarit phức tạp.
Thông hiểu: Sử dụng công thức mũ, logarit biến đổi các biểu thức mũ logarit
23
32
36
26
17
Thông hiểu: Giải các bất phƣơng trình mũ , logarit dạng thƣờng gặp . Tìm tập xác định của hàm
19
31
23
41
18
113
số hàm số logarit. Tính toám biểu thức logarit phức tạp.
Thông hiểu: Đạo hàm, tính chất của hàm số mũ, logarit, lũy thừa dạng hàm hợp. Tập xác định
32
24
4
21
19
của hàm số hợp của hàm số lũy thữa, các bài toán ứng dụng đơn giản.
Vận dụng: Phƣơng trình , bất phƣơng trình, hệ phƣơng trình mũ chứa tham số, Phƣơng trình, bất
phƣơng trình , hệ phƣơng trình lôgarit chứa tham số, Cực trị hàm mũ, logarit. Nhận dạng đồ thị
36
36
25
43
20
với các tính chất đạo hàm của hàm số.
Vận dụng cao: Sử dụng công thức mũ,logarit, tính chất hàm số mũ, logarit trong các bài toán về
tính chất , giá trị lớn nhất , nhỏ nhất của hàm số hợp của hàm số mũ, hàm số logarit, Phƣơng trình
47
49
44
47
21
mũ phức tạp, các ứng dụng thực tế
Nhận biết: Khái niệm nguyên hàm, tích phân. Tìm họ nguyên hàm đơn giản
7
2
18
8
22
Nhận biết : Tính chất của nguyên hàm, tích phân và mối liên hệ giữa tích phân và nguyên hàm.
29
9
28
32
23
Tìm họ nguyên hàm của hàm số dựa vào bảng nguyên hàm, tính chất nguyên hàm
3. Nguyên
Thông hiểu : Tính tích phân của hàm số
17
20
42
25
hàm - tích
24
Thông hiểu : Ứng dụng tích phân trong bài toán diện tích, thể tích đơn giản
phân và
40
40
38
19
25
ứng dụng
Thông hiểu: Sử dụng tìm nguyên hàm, tích phân với các câu hỏi khác
26
29
46
30
26
(7 câu)
Vận dụng : Tính tích phân, kĩ thuật tính và ứng dụng
49
42
10
46
27
Vận dụng cao: Sử dụng tìm nguyên hàm, tính tích phân của hàm số với các bài toán liên quan
31
48
14
37
28
khác. Ứng dụng vào bài toán thực tế
Nhận biết: Xác định các tham số cơ bản của số phức
3
11
7
9
4.
Số
29
phức
Nhận biết: Các phép toán cơ bản với số phức, Các dạng biểu diễn của số phức
11
6
2
4
30
114
Nhận biết: Nghiệm phƣơng trình bậc nhất, bậc hai hệ số thực của số phức.
(6 câu)
22
15
19
15
31
Thông hiểu: Các bài toán tính toán liên quan đến dạng biểu diễn của số phức, nghiệm phức của
38
38
20
40
32
phƣơng trình.
Thông hiểu: Các bài toán liên quan đến môđun, đến tính toán biểu thức phức
42
25
40
29
33
Vận dụng: Các tính toán phức tạp, các bài toán hình học liên quan đến mô đun số phức.
48
46
47
48
34
Nhận biết: Thể tích khối chóp dễ xác định đƣờng cao, diện tích đáy. Thể tích khối lăng trụ đứng
24
30
11
23
35
dễ xác định đƣờng cao, diện tích đáy
Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố cạnh hoặc góc đơn giản . Tính thể
41
41
22
29
36
tích khối lăng trụ đứng có liên quan đến yếu tố cạnh hoặc góc đơn giản
Thông hiểu: Các khái niệm liên quan đến khối đa diện: Mặt, cạnh, đỉnh, mặt đối xứng,…, đa
5.
13
23
43
14
37
diện đều. Phân chia khối đa diện.
Thể tích
khối đa
Vận dụng: Tính thể tích khối chóp có sử dụng kiến thức ở mức độ cao hơn về quan hệ vuông
diện
góc, góc, khoảng cách để xác định đƣờng cao, diện tích đáy. Tính thể tích khối lăng trụ có sử
(5 câu)
dụng kiến thức ở mức độ cao hơn về quan hệ vuông góc, góc, khoảng cách để xác định đƣờng
21
16
35
12
38
cao, diện tích đáy. Tính thể tích khối lăng trụ, khối hộp xiên. Kết hợp khối tròn xoay và khối đa
diện.
Vận dụng cao: Tính thể tích khối chóp không xác định trực tiếp phải sử dụng thông qua tỉ số thể
44
44
48
45
39
tích, phân chia khối đa diện. Cực trị khối đa diện.
Nhận biết: Công thức thể tích khối nón, diện tích xung quanh, diện tích toàn phần của hình nón.
6.
5
39
13
31
40
Công thức tính thể tích khối trụ, diện tích xung quanh ,diện tích toàn phần hình trụ. Diện tích mặt
Khối tròn
115
cầu và thể tích khối cầu.
xoay
(3 câu)
Thông hiểu: Khối nón có liên quan thiết diện. Khối trụ có liên quan thiết diện
39
22
45
35
41
Vận dụng: Xác định tâm và tính bán kính mặt cầu ngoại tiếp khối chóp. Nón, trụ có liên quan
đến góc, khoảng cách, thiết diện. Thể tích khối trụ, diện tích xung quanh ,diện tích toàn phần
45
45
24
50
42
hình trụ- Bài toán thực tế.
Nhận biết: Các phép toán về véc tơ, điểm.
10
10
5
11
43
Nhận biết: Viết, xác định phƣơng trình mặt phẳng khi biết một điểm và một vec tơ pháp tuyến
20
1
21
10
44
Nhận biết: Viết, xác định phƣơng trình đƣờng thẳng khi biết một điểm và một vectơ chỉ phƣơng
2
17
3
24
45
Nhận biết: Viết phƣơng trình mặt cầu khi biết tâm và bán kính.
16
26
26
17
46
7. Phƣơng
Thông hiểu: Các bài toán viết phƣơng trình mặt phẳng, đƣờng thẳng cần xác định đƣợc vectơ
pháp tọa
pháp tuyến hay chỉ phƣơng liên quan điểm các đƣờng thẳng, mặt phẳng đặc biệt.(hình chiếu,
28
19
16
28
47
độ
trong
khoảng cách từ điểm lên các trục Ox, hay mặt phẳng (Oxy)
không
Thông hiểu: Các bài toán liên quan đến tƣơng giao, hình chiếu, khoảng cách của điểm, đƣờng
gian
33
33
33
34
48
thẳng, mặt phẳng.
(8 câu)
Vận dụng: Các bài toán tìm điểm trên mặt phẳng, đƣờng thẳng,… thỏa mãn các điều kiện cho
50
37
41
36
49
trƣớc.
Vận dụng cao: Ứng dụng hình giải tích vào hình không gian hoặc xử lý các bài toán cực trị hình
37
50
49
49
50
học liên quan đến véc tơ, điểm, mặt phẳng, mặt cầu, đƣờng thẳng.
116
Phụ lục 5: Đề thi thử nghiệm 01
TRƢỜNG THPT
(Đề thi có 06 trang) KÌ THI KIỂM TRA KIẾN THỨC LỚP 12 Môn: Toán Thời gian làm bài: 90 phút
Họ, tên thí sinh:.......................................................................... Số báo danh:............................................................................... Câu 1: Đƣờng cong trong hình bên là đồ thị của một trong bốn hàm số đƣợc liệt kê ở bốn phƣơng án A, B, C, D. Hỏi hàm số đó là hàm số nào ? A. B. C. D.
Câu 2: Tìm tất cả các tiệm cận của đồ thị hàm số
A.
và
B.
và
C.
và
D.
và
Câu 3: Cho hàm số
Mệnh đề nào dƣới đây sai ?
A. Hàm số đã cho có tập xác định là B. Hàm số đã cho đồng biến trên khoảng C. Đồ thị của hàm số đã cho có tiệm cận ngang là trục D. Đồ thị của hàm số đã cho đi qua điểm
là điểm biểu diễn của số phức nào dƣới đây
C.
Câu 4: Trên mặt phẳng tọa độ, điểm ? A.
B.
D.
đồng biến trên khoảng nào dƣới đây ?
C.
D.
Câu 5: Hàm số A.
B.
bất kì. Mệnh đề nào dƣới đây đúng ? B. D.
Câu 6: Xét các số thực dƣơng A. C. Câu 7: Cho hàm số xác định, liên tục trên tập số thực và có bảng biến thiên nhƣ hình bên. Mệnh đề nào dƣới đây đúng ?
A. Cực đại của hàm số bằng -4. C. Cực đại của hàm số bằng 1.
B. Cực đại của hàm số bằng -3. D. Cực đại của hàm số bằng 0.
117
Câu 8: Tìm nguyên hàm của hàm số
A.
B.
C.
D.
và phần ảo
B.
Câu 9: Tìm phần thực A.
của số phức
C.
D.
cho mặt phẳng
Câu 10: Trong không gian với hệ tọa độ Vectơ nào dƣới đây không phải là vectơ pháp tuyến của
A.
B.
C.
D.
Câu 11: Trong không gian với hệ tọa độ
điểm nào dƣới đây thuộc mặt phẳng
A.
B.
C.
D.
. Gọi
và
Câu 12: Cho hình lập phƣơng cạnh lần lƣợt là thể tích khối cầu ngoại tiếp, thể tích khối cầu nội tiếp và thể tích khối cầu tiếp xúc với tất cả các cạnh của hình lập phƣơng đã cho. Mệnh đề nào dƣới đây đúng ?
A.
B.
C.
D.
có đạo hàm
Hỏi hàm số
đồng biến trên
B.
D.
có các điểm
C. lần lƣợt nằm
Câu 13: Cho hàm số khoảng nào dƣới đây ? A. Câu 14: Cho tứ diện
trên hai cạnh
Hỏi hai mặt phẳng
và
thành bao nhiêu khối tứ diện ?
phân chia khối tứ diện A. B. C. D.
Câu 15: Tính môđun của số phức
biết
A.
B.
C.
D.
có đồ thị nhƣ hình để có nghiệm thuộc khoảng
Câu 16: Cho hàm số bên. Tìm tất cả các giá trị của tham số thực phƣơng trình
A. B. C. D.
118
Câu 17: Trong không gian với hệ tọa độ
cho hai điểm
và
Phƣơng trình nào dƣới đây là phƣơng trình mặt cầu đi qua
và có tâm là
A.
B.
C.
D.
của tất cả các nghiệm của phƣơng trình
Câu 18: Tính tổng A.
B.
D.
C.
trục hoành, trục
Câu 19: Tính diện tích tung và đƣờng thẳng
của hình phẳng giới hạn bởi đồ thị ?
A.
B.
D.
C.
Câu 20: Tìm tập xác định D của hàm số
A.
C.
B. D.
Câu 21: Tính đạo hàm của hàm số
A.
B.
C.
D.
có bao nhiêu điểm cực tiểu ?
B. 2.
C. 3.
của khối lăng trụ tam giác đều có cạnh đáy bằng
D. 0. và chiều cao
Câu 22: Hàm số A. 1. Câu 23: Tính thể tích bằng
A.
B.
C.
D.
Câu 24: Trong không gian với hệ tọa độ
cho điểm
và đƣờng thẳng
Phƣơng trình đƣờng thẳng đi qua
và song song với là:
A.
B.
C.
D.
Câu 25: Cho hàm số
Tính
A.
B.
D.
C.
Câu 26: Cho biểu thức
Mệnh đề nào dƣới đây đúng ?
A.
B.
D.
C.
Câu 27: Tìm giá trị lớn nhất
của hàm số
119
A.
B.
C.
D.
Câu 28: Trong không gian với hệ tọa độ
cho điểm
. Gọi
và
lần
lƣợt là hình chiếu vuông góc của
lên các trục
và
Viết phƣơng trình
mặt phẳng
A. C.
B. D.
Câu 29: Cho các số thực
và
thỏa mãn
Tính
A.
B.
D.
C.
Câu 30: Hàm số nào dƣới đây không là nguyên hàm của hàm số
A.
B.
C.
D.
Câu 31: Trong không gian, cho hình chữ nhật
có
Tính bán kính
của hình trụ nhận đƣợc khi quay hình chữ nhật
xung quanh trục
A.
B.
C.
? D.
Câu 32: Biết
tính
B.
D.
C.
A. Câu 33: Tìm tất cả các giá trị của tham số thực
để đƣờng thẳng
cắt đồ thị
tại hai điểm phân biệt
sao cho trung điểm của đoạn
thuộc trục
hàm số
hoành.
A.
B.
C.
D.
Câu 34: Trong không gian với hệ tọa độ
cho đƣờng thẳng
Viết phƣơng trình đƣờng thẳng
đối xứng với
qua mặt phẳng
A.
B.
C.
D.
Câu 35: Hai hình chữ nhật có kích thƣớc đƣợc xếp chồng một phần lên nhau sao cho chúng đều nhận làm trục đối xứng tạo thành một hình phẳng nhƣ của vật thể tròn xoay sinh
hình bên. Tính thể tích bởi hình phẳng đã cho khi quay quanh A. C.
B. D.
120
Câu 36: Trong không gian với hệ tọa độ
cho hai điểm
và
đƣờng thẳng
Điểm
thay đổi thuộc
tính giá trị nhỏ nhất
của
tích vô hƣớng
A.
B.
C.
D.
Câu 37: Một viên đá đƣợc bắn thẳng đứng lên trên với vận tốc ban đầu là 40 m/s từ một điểm cao 5 mét cách mặt đất. Vận tốc của viên đá sau t giây đƣợc cho bởi công thức (m/s). Tính độ cao lớn nhất viên đá có thể lên tới so với mặt đất.
A. 80 m.
B. 75 m.
C. 90 m.
D. 85 m.
Câu 38: Cho
theo
và
Tính
A.
B.
D.
C.
Câu 39: Gọi
,
lần lƣợt là diện tích toàn phần của hình lập phƣơng
và diện tích toàn phần của tứ diện
Tính
A.
B.
C.
D.
Câu 40: Cho
là số thực sao cho phƣơng trình
có một nghiệm phức là
Kí hiệu
là nghiệm còn lại của phƣơng trình đã cho và
Mệnh
đề nào dƣới đây đúng ?
A.
B.
C.
D.
Câu 41: Tập hợp tất cả các số thực
thỏa mãn
là tập nào dƣới đây ?
A.
B.
C.
D.
Câu 42: Tìm tất cả các giá trị của tham số thực
để hàm số
nghịch biến trên
C.
D.
B.
khoảng A. Câu 43: Trong hình bên là đồ thị của và ba hàm số
(
và
là các số thực dƣơng khác 1). Mệnh đề nào dƣới đây đúng ? A. B. C. D.
121
Câu 44: Một màn ảnh hình chữ nhật cao 1,8 mét đƣợc đặt ở độ cao 2 mét so với tầm mắt (tính từ đầu mép dƣới của màn hình nhƣ hình bên). Để nhìn rõ nhất phải xác định vị trí đứng
sao cho góc nhìn lớn nhất (
gọi là góc
nhìn). Tính độ dài đoạn
B. A.
D. C.
có độ dài cạnh đáy bằng
thuộc cạnh
và
vuông góc với mặt phẳng
, điểm Tính thể tích
của khối
Câu 45: Cho hình chóp đều sao cho chóp
.
A.
B.
C.
D.
Câu 46: Cho hàm số
có đồ thị nhƣ hình
bên (với
). Biết
và
Tính
A.
B.
C.
D.
Câu 47: Tìm số nghiệm của phƣơng trình
A. 2.
B. 1.
C. 3.
D. 4.
Câu 48: Trong tất cả các số
thỏa mãn
tìm số phức
có môđun nhỏ nhất ?
A.
B.
C.
D.
Câu 49: Trong không gian với hệ tọa độ
cho ba điểm
và
Tập hợp các điểm
sao cho
là một mặt cầu
điểm
nào dƣới đây là tâm của
A.
B.
C.
D.
122
Câu 50: Cho khối đa diện có các đỉnh là tâm các mặt bên của một hình lập phƣơng có cạnh bằng 2 đi qua tất nhƣ hình bên. Xét hình nón tròn xoay
cả các đỉnh của đa diện
đỉnh của
và tâm
mặt đáy của
lần lƣợt là hai đỉnh của đa diện
nằm trên hai mặt bên đối nhau của hình lập
phƣơng . Tính thể tích
của
A.
B.
C.
D.
-----------------------------------------------
----------- HẾT ----------
123