Luận văn Thạc sĩ Giáo dục học: Triển khai đánh giá kết quả học tập môn Toán lớp 12 bằng một đề tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƢỜNG ĐẠI HỌC GIÁO DỤC

------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN LỚP

12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU HỎI NHỊ PHÂN,

ĐA PHÂN VÀ ĐA CHIỀU

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC

Hà Nội - 2017

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƢỜNG ĐẠI HỌC GIÁO DỤC

------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN

LỚP 12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU

HỎI NHỊ PHÂN, ĐA PHÂN VÀ ĐA CHIỀU

CHUYÊN NGÀNH: ĐO LƢỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC

Mã số: 8140115

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC

Ngƣời hƣớng dẫn khoa học: GS.TSKH. LÂM QUANG THIỆP

Hà Nội - 2017

LỜI CAM ĐOAN

Tôi xin cam đoan, Luận văn Thạc sĩ Đo lƣờng và đánh giá trong giáo dục với

đề tài: “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề tổng

hợp với các câu hỏi nhị phân, đa phân và đa chiều” là công trình nghiên cứu

riêng của tôi, dƣới sự hƣớng dẫn của GS.TSKH. LÂM QUANG THIỆP.

Tôi xin cam đoan:

- Luận văn là sản phẩm nghiên cứu của tôi

- Các thông tin, số liệu, kết quả nghiên cứu trong luận văn là trung thực và chƣa

từng đƣợc ai công bố trong bất kỳ phƣơng tiện thông tin đại chúng nào trƣớc đây.

Tôi xin chịu trách nhiệm về kết quả nghiên cứu của mình

Tác giả luận văn

Trần Văn Thanh

LỜI CẢM ƠN

Tôi xin gửi lời cảm ơn trân trọng đến những ngƣời đã giúp đỡ tôi hoàn thành

luận văn này.

Trƣớc hết, tôi xin trân trọng cảm ơn các lãnh đạo Trƣờng Đại Học Giáo dục,

Bộ môn Đo lƣờng và đánh giá, các thầy, cô của trƣờng Đại Học Giáo dục đã tận

tình giảng dạy, hƣớng dẫn và giúp đỡ tôi trong quá trình học tập, nghiên cứu và làm

luận văn.

Tôi xin bày tỏ sự biết ơn sâu sắc đến: GS.TSKH. Lâm Quang Thiệp, thầy

đã tận tâm giúp đỡ, hƣớng dẫn tôi trong quá trình nghiên cứu, thực hiện đề tài. Đặc

biệt trong những lúc tôi gặp khó khăn về định hƣớng, động lực nghiên cứu, thầy đã

động viên và hƣớng dẫn tôi cặn kẽ.

Tôi xin chân thành cảm ơn đồng nghiệp, gia đình và bạn bè đã luôn động

viên, khuyến khích tôi trong suốt quá trình học tập và nghiên cứu.

Xin chân thành cảm ơn

Tác giả luận văn

Trần Văn Thanh

MỤC LỤC

Trang

LỜI CAM ĐOAN

LỜI CÁM ƠN

MỤC LỤC

vi DANH MỤC CÁC TỪ VIẾT TĂT ………………………………………….

vii DANH MỤC CÁC HÌNH VẼ ……………………………………………….

DANH MỤC CÁC BẢNG BIỂU …………………………………………… viii

MỞ ĐẦU …………………………………………………………………… 1

1. Lý do chọn đề tài …………………………………………………………. 1

2. Mục đích nghiên cứu ……………………………………………………... 2

3. Đối tƣợng và khách thể nghiên cứu ………………………………………. 3

4. Câu hỏi nghiên cứu và giả thuyết nghiên cứu ……………………………. 3

5. Phƣơng pháp nghiên cứu …………………………………………………… 4

6. Giới hạn và phạm vi nghiên cứu …………………………………………. 4

7. Cấu trúc của luận văn …………………………………………………… 4

Chƣơng 1: Cơ sở lý luân và tổng quan vấn đề nghiên cứu …………………. 5

1. 1. Tổng quan về đo lƣờng trong giáo dục ………………………………… 5

1.1.1. Các khái niệm cơ bản về đo lƣờng đánh giá …………………………. 5

1.1.2. Các phƣơng pháp đo lƣờng trong giáo dục …………………………… 7

1.1.3. Đánh giá kết quả học tập của học sinh ……………………………….. 8

1.1.4. Công cụ đo lƣờng kết quả học tập ……………………………………. 9

1.1.5. Sơ lƣợc về khoa học đo lƣờng đánh giá trên thế giới và Việt Nam ….. 12

1.2. Lý thuyết đánh giá cổ điển ……………………………………………… 15

1.2.1. Các tham số đặc trƣng của câu hỏi trắc nghiệm và phân tích đề trắc 16 nghiệm ……………………………………………………………………….

1.2.2. Điểm số học tập ………………………………………………………. 20

1.3. Lý thuyết ứng đáp câu hỏi ……………………………………………… 24

iii

1.3.1 Tổng quan về lý thuyết ứng đáp câu hỏi ……………………………… 24

1.3.2. Hàm đặc trƣng câu hỏi ……………………………………………….. 25

1.3.3. Điểm thực và đƣờng cong đặc trƣng đề trắc nghiệm ……………........ 29

1.3.4. Hàm thông tin của câu hỏi và của đề trắc nghiệm ……………………. 30

1.3.5. Ƣớc lƣợng năng lực thí sinh và tham số câu hỏi ……………………... 33

1.3.6. So bằng và kết nối các đề trắc nghiệm ……………………………. … 33

1.3.7. Về trắc nghiệm đa phân và trắc nghiệm đa chiều …………………. … 34

1.3.8. Ví dụ về ƣớc lƣợng tham số câu hỏi ………………………………. … 38

Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi …………………………... 47

2.1. Đặt vấn đề ……………………………………………………………… 47

2.2. Quy trình xây dựng một đề thi, đề kiểm tra ……………………………. 47

2.2.1. Qui trình xây dựng ngân hàng câu hỏi trắc nghiệm khách quan ……... 49

2.2.2. Quy trình triển khai một kỳ thi trắc nghiệm khách quan …………….. 50

2.3. Xây dựng đề thi môn toán ……………………………………………… 52

2.3.1. Chuẩn bị ………………………………………………………………. 53

2.3.2. Xây dựng bảng ma trận trọng số ……………………………………… 53

2.3.3. Biên soạn câu hỏi thi …………………………………………………. 60

2.4. Thử nghiệm đề thi ………………………………………………………. 66

2.4.1. Chọn mẫu nghiên cứu ………………………………………………… 66

2.4.2. Kế hoạch thực hiện …………………………………………………… 66

2.4.3. Kết quả thử nghiệm …………………………………………………… 66

Chƣơng 3: Kết quả nghiên cứu ……………………………………………… 68

3.1. Giới thiệu ……………………………………………………………….. 68

3.2. Phân tích tham số câu hỏi thi …………………………………………… 69

3.2.1. Phân tích câu hỏi thi bằng CTT ………………………………………. 70

3.2.2. Phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại ……………….. 71

3.2.3. Phân tích câu hỏi thi đa chiều ………………………………………… 80

3.2.4. Phân tích câu hỏi thi đa phân ………………………………………… 85

3.3. Một số kết quả phân tích câu hỏi thi ……………………………………. 85

3.3.1. Quy trình hiệu chuẩn đề kiểm tra …………………………………….. 85

3.3.2. Các đặc trƣng về các đề thử nghiệm …………………………………. 86

KẾT LUẬN ………………………………………………………………..... 91

KHUYẾN NGHỊ …………………………………………………………..... 92

DANH MỤC TÀI LIỆU THAM KHẢO …………………………………… 93

PHỤ LỤC …………………………………………………………………… 94

Phụ lục 1: Phân phối chƣơng trình toán Lớp 12 …………………………… 94

Phụ lục 2: Phụ lục 2: Mẫu đặc tả kiến thức môn toán 12 theo chuẩn kiến 95 thức kĩ năng bộ giáo dục ban hành. ………………………………………….

Phụ lục 3: Định dạng biên soạn câu hỏi thi. ………………………………… 100

Phụ lục 4: Đặc tả nội dung kiến thức từng câu hỏi theo ma trận trọng số 101 trong đề thi. ………………………………………………………………….

Phụ lục 5: Đề thi thử nghiệm 01 . …………………………………………… 106

DANH MỤC CÁC TỪ VIẾT TẮT

Từ viết tắt Ý nghĩa

Bộ giáo dục BGD

Câu hỏi CH

Classical Test Theory CTT

Độ khó vừa phải ĐKVP

Đặc trƣng câu hổi ĐTCH

Đề ttrắc nghiệm ĐTN

Học sinh HS

Item response theory IRT

Item Curve Function ICF

NHCH Ngân hàng câu hỏi

Partial Credit Model PCM

Trung học phổ thông THPT

Tự luận TL

TNKQ Trắc nghiệm khách quan

Trắc nghiệm TN

Thí sinh TS

DANH MỤC CÁC BẢNG BIỂU

Tên bảng Trang STT

1 Bảng 1.1 So sánh ƣu nhƣợc điểm của đề thi TNKQ và tự luận 10

2 Bảng 1.2 Hình thức thi TNKQ và tự luận 10

3 Bảng 1.3 Mô tả câu nhóm các câu hỏi trắc nghiệm 19

4 Bảng 1.4 Dữ liệu thử nghiệm của câu hỏi thi 41

5 Bảng 1.5 Dữ liệu tính toán ƣớc lƣợng hàm đặc trƣng câu hỏi 43

6 Bảng 1.6 Dữ liệu tính toán ƣớc lƣợng hàm đặc trƣng câu hỏi 43

7 Bảng 2.1 Quy trình xây dựng đề thi 52

8 Bảng 2.2 Ma trận đề thi môn toán 12 54

9 Bảng 2.3 Bảng mô tả chi tiết từng câu hỏi trong đề thi 55

10 Bảng 2.4 Quy trình biên soạn câu hỏi thi 60

11 Bảng 2.5 Bảng xây dựng câu hỏi thi 61

12 Bảng 2.6 Mẫu lƣu kết quả câu hỏi thi 67

13 Bảng 3.1 Độ khó P của một câu hỏi trắc nghiệm số 1. 70

14 Bảng 3.2 Bảng tham số các hỏi thi về mức độ phù hợp 71

15 Bảng 3.3 Phân tích đa chiều năng lực của TS với đề thi 01. 81

vii

DANH MỤC CÁC HÌNH VẼ

Tên hình vẽ Trang STT

1 Hình 1.1. Đƣờng cong ĐTCH một tham số 26

Hình 1.2. Các đƣờng cong ĐTCH hai tham số với các giá trị a khác 2 27 nhau

Hình 1.3. Các đƣờng cong ĐTCH 3 tham số với a = 2, c = 0,1 và 3 28 0,2.

Hình 1.4. Đƣờng cong đặc trƣng của ĐTN gồm 5 CH và 5 đƣờng 4 30 cong ĐTCH tƣơng ứng.

Hình 1.5. Các đồ thị hàm thông tin của 5 CH trắc nghiệm và của 5 31 ĐTN do 5 CH đó hợp thành

Hình 1.6. Các đƣờng cong ĐTCH trắc nghiệm nhị phân ứng với xác 6 36 suất trả lời sai

Hình 1.7. Các đƣờng cong ĐTCH của một CH PCM có 3 hạng điểm 7 36 (với δ1<δ2).

8 37 Hình 1.8. Mặt ĐTCH với 2 chiều năng lực θ1,θ2

Hình 1. 9. Hai kiểu biểu hiện tính đa chiều của các câu hỏi trắc 9 37 nghiệm.

10 Hình 1.10. Mô tả đáp ứng câu hỏi 39

11 Hình 1.11. Hàm đặc trƣng câu hỏi 40

12 Hình 1.12. Ƣớc lƣợng hàm đặc trƣng của câu hỏi 41

13 Hình 1.13. Tham số ƣớc lƣợng của câu hỏi 42

14 Hình 1.14. Đồ thị hàm đặc trƣng của câu hỏi 42

15 Hình 1.15. Đồ thị của hàm đặc trƣng câu hỏi 44

Hình 1.16. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có 16 45 năng lực thấp

Hình 1.17. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có 17 45 năng lực cao

viii

Hình 1.18. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có 18 45 năng lực phổ quát

19 Hình 3.1. Đồ thị hàm đặc trƣng câu hỏi số 4. 73

20 Hình 3.2. Đồ thị hàm đặc trƣng câu hỏi số 21 73

21 Hình 3.3. Đồ thị hàm đặc trƣng câu hỏi số 39 74

22 Hình 3.4. Đồ thị hàm đặc trƣng câu hỏi số 40 74

23 Hình 3.5. Bản đồ phân bố độ khó câu hỏi thi và năng lực thí sinh 75

24 Hình 3.6. Đƣờng cong đặc trƣng của đề thi số 1. 77

25 Hình 3.7. Hàm thông tin của đề thi số 1. 78

26 Hình 3.8. Hàm thông tin của đề thi số 2. 78

27 Hình 3.9. Hàm thông tin của đề thi số 3. 79

28 Hình 3.10. Hàm thông tin của đề thi số 4. 79

29 Hình 3.11. Năng lực giải tích của TS 82

30 Hình 3.12. Năng lực đại số của TS 83

31 Hình 3.13. Năng lực hình học của TS 84

Hình 3.14. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 32 87 của đề thi 01

Hình 3.15. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 33 88 của đề thi 02

Hình 3.16. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 34 89 của đề thi 03

Hình 3.17. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó 35 90 của đề thi 04

MỞ ĐẦU

1. Lý do chọn đề tài

Hiện nay có hai hình thức thi cử kiểm tra chủ yếu trong các cơ sở giáo dục là

trắc nghiệm khách quan và tự luận.

Việc kiểm tra đánh giá ở các nhà trƣờng từ trƣớc đến nay phần lớn đều sử dụng

phƣơng pháp kiểm tra bằng hình thức tự luận. Phƣơng pháp này có ƣu điểm nổi bật là

ít tốn thời gian ra đề; đánh giá đƣợc khả năng trình bày, diễn đạt của học sinh; khuyến

khích học sinh rèn luyện khả năng tƣ duy logic, khả năng suy diễn, tổng quát hóa, phát

huy óc sáng tạo của học sinh. Tuy vậy kiểm tra bằng tự luận cũng tồn tại nhiều hạn chế

nhƣ không thể kiểm tra đƣợc một cách đầy đủ các kiến thức và kỹ năng của học sinh

dẫn đến tình trạng học tủ, học lệch. Kết quả kiểm tra đánh giá không đảm bảo tính

chính xác, khách quan mà phụ thuộc nhiều vào đánh giá chủ quan của ngƣời chấm.

Hơn nữa, việc chấm điểm tốn rất nhiều thời gian và công sức, đặc biệt là với số lƣợng

lớn.

Hình thức kiểm tra trắc nghiệm cũng đƣợc triển khai trên thế giới từ những năm

đầu thế kỷ 20, và đƣợc du nhập vào nƣớc ta tại một số thời điểm trƣớc năm 75 ở miền

Nam. Đặc biệt bộ giáo dục (BGD) đã bắt đầu đƣa vào kì thi Quốc gia với các môn Lí,

Hóa, Sinh, Ngoại ngữ từ năm 2007 và các môn Toán, Sử, Địa từ năm 2017 hình thức

thi trắc nghiệm khách quan. Các ƣu điểm nổi bật của kì thi đã đƣợc chứng minh nhƣ

khách quan, công bằng, tiết kiệm thời gian, tiền bạc. Tuy vậy việc đƣa kì thi vào tƣơng

đối vội vàng, chƣa có chuẩn bị đào tạo một cách bài bản nên gây nhiều khó khăn cho

giáo viên, học sinh trong các khâu kiểm tra, đánh giá. Đặc biệt hơn do chƣa có kinh

nghiệm nên các đề thi trắc nghiệm khách quan đƣợc biên soạn chủ yếu với đo đƣợc

kiến thức ở mức nhận biết, thông hiểu, còn các thang kiến thức ở mức áp dụng, phân

tích, tổng hợp chƣa đo lƣờng một cách chính xác. Điều đó là một phần khó khăn cho

việc phân loại học sinh với các môn tƣ duy logic cao nhƣ môn toán.

Việc học và thi trên thế giới đã diễn ra hàng nghìn năm trƣớc đây, nhƣng một

khoa học về đo lƣờng trong giáo dục thật sự có thể xem nhƣ bắt đầu từ thế kỉ XX, tại

châu Âu và phát triển mạnh khi du nhập vào Hoa Kỳ [3, tr. 51].

Trong đo lƣờng giáo dục, hai hệ lý thuyết đánh giá cơ bản đang đƣợc sử dụng:

Lý thuyết đánh giá cổ điển (Classical Test Theory - CTT)

Lý thuyết đánh giá hiện đại (Modern Test Theory)

Hiện nay cách thức xây dựng đề thi đa số dựa theo lý thuyết đánh giá cổ điển,

nhƣng cách phân tích đánh giá câu hỏi thi, đề thi thƣờng kết hợp cả lý thuyết đánh giá

cổ điển lẫn lý thuyết đánh giá hiện đại. Hai hình thức đánh giá này thƣờng bổ xung các

ƣu nhƣợc điểm cho nhau nên chúng thƣờng đƣợc sử dụng đồng thời. Một trong những

trở ngại của lý thuyết khảo thí cổ điển là vấn đề chọn mẫu, chuẩn hóa và so bằng. Lý

thuyết khảo thí hiện đại, thƣờng đƣợc gọi là lý thuyết ứng đáp câu hỏi (IRT) hoàn toàn

dễ dàng khắc phục các khó khăn này nhƣng lại có những tính toán ƣớc lƣợng phức tạp.

Khoảng hai chục năm gần đây, các nghiên cứu sâu về IRT diễn ra ở nhiều nơi trên thế

giới đặc biệt là Hoa Kì. Tuy vậy các bài viết về IRT chủ yếu mang tính lí thuyết, nặng

nề về các công thức toán học nên việc triển khai, ứng dụng IRT trong công tác xây

dựng đề là chƣa nhiều, chủ yếu sử dụng IRT trong công việc phân tích đánh giá đề thi.

Lý thuyết đo lƣờng hiện đại đã dần chứng tỏ các ƣu điểm của nó so với lý

thuyết đo lƣờng cổ điển. Hiện nay các công cụ hỗ trợ tính toán phức hợp (máy tính

điện tử, phần mềm chuyên dụng,…) đƣợc phổ biến thì nhu cầu ứng dụng các kết quả

nghiên cứu của lý thuyết khảo thí hiện đại vào thực tế ra đề thi trong các kì thi quốc

gia hay trong các nhà trƣờng phổ thông càng trở nên bức thiết. Với mong muốn lý

thuyết IRT sớm đƣợc phổ biến trong công tác khảo thí đo lƣờng ở Việt Nam, tôi chọn

nghiên cứu đề tài “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề

tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều” nhằm thiết kế bộ đo năng lực

môn toán của học sinh phổ thông, kiểm tra đánh giá đƣợc một cách hệ thống và toàn diện

kiến thức và kỹ năng của học sinh sau khi học xong môn toán lớp 12. Đồng thời đƣa ra

một quy trình xây dựng đề thi có ứng dụng lý thuyết khảo thí hiện đại vào quá trình xây

dựng đề. Từ đó có thể đánh giá ƣu nhƣợc điểm của các hình thức và cách thức ra đề.

Xem xét hai hình thức đo lƣờng đánh giá này có bổ xung, tồn tại cùng nhau hay loại

trừ nhau. Điều này làm cho các kì thi kiểm tra, đánh giá năng lực của học sinh trở nên

đơn giản và chính xác hơn.

2. Mục đích nghiên cứu

2

Nghiên cứu tập chung tìm hiểu cách xây dựng, thiết kế một đề thi môn toán lớp

12 và phân tích đánh giá đề thi theo lý thuyết đánh giá hiện đại (IRT).

3. Đối tƣợng và khách thể nghiên cứu

Đối tƣợng nghiên cứu: Cơ sở lý luận của việc kiểm tra đánh giá kết quả học tập

của học sinh ở nhà trƣờng phổ thông, phƣơng pháp soạn thảo, phân tích hệ thống câu

hỏi thi theo lý thuyết đánh giá hiện đại.

Khách thể nghiên cứu: Nội dung và các yêu cầu về kiến thức, kĩ năng môn toán

lớp 12. Học sinh đã hoàn thành chƣơng trình toán 12.

4. Câu hỏi nghiên cứu và giả thuyết nghiên cứu

Việc xây dựng đề thi nói chung và đề thi THPT quốc gia nói riêng cho đến nay

vẫn đang diễn ra chủ yếu dựa trên cơ sở của lý thuyết đánh giá cổ điển, phụ thuộc

nhiều vào các chuyên gia (cảm tính) ra đề. Mức độ khó dễ, phân biệt, giá trị, tin cậy

của câu hỏi trong các đề thi phụ cảm tính nhiều vào hội đồng ra đề thi (tuổi tác, giới

tính, vùng miền, trình độ,…) nên việc chỉnh sửa những câu hỏi thi không tốt trong các

đề thi thử nghiệm là rất khó khăn. Xây dựng ngân hàng câu hỏi một cách khách quan,

tin cậy, giá trị luôn đƣợc đặt lên hàng đầu trong mỗi kì thi. Mặc dù có nhiều khó khăn

khi tiếp cận IRT (các nghiên cứu về IRT chủ yếu là lí thuyết chƣa có nhiều triển khai

mang tính ứng dụng, các công thức tính toán nhiều, cần phần mềm chuyên dụng, …)

nhƣng lý thuyết IRT sẽ phần nào đáp ứng đƣợc việc xây dựng một ngân hàng câu hỏi,

ngân hàng đề theo sát các tiêu chí của một đề thi quốc gia trung học phổ thông. Do vậy

việc xây dựng ngân hàng câu hỏi thi theo định dạng câu hỏi nhị phân, đa phân, đa

chiều đang là bài toán đƣợc tập chung nghiên cứu nhiều gần đây không chỉ ở trên thế

giới mà ở Việt Nam cũng đang đƣợc quan tâm.

Câu hỏi nghiên cứu:

Câu hỏi 1: Việc xây đề thi môn toán lớp 12 ứng dụng theo lý thuyết đánh giá

hiện đại cần thực hiện nhƣ thế nào?

Câu hỏi 2: Phân tích các câu hỏi thi nhị phân, đa phân, đa chiều trong một đề thi

có giúp nâng cao chất lƣợng đề thi hay không?

3

Giả thuyết nghiên cứu: Dựa trên mục đích của kì thi, nguyên tắc viết câu hỏi

thi, ta có ma trận chi tiết của đề thi từ đó xây dựng đề thi. Thử nghiệm và xác định

tham số đặc trƣng của câu hỏi thi từ đó đánh giá chất lƣợng câu hỏi thi, tiến đến chuẩn

hóa đề thi.

4

5. Phƣơng pháp nghiên cứu

Nghiên cứu sử dụng cả phƣơng pháp định tính và định lƣợng trong việc thu

thập và xử lí thông tin. Nghiên cứu dự định tiến hành thông qua ba giai đoạn: Nghiên

của cơ sở lý thuyết, xây dựng mô hình nghiên cứu và các thử nghiệm. Các phƣơng

pháp nghiên cứu đƣợc sử dụng kết hợp phù hợp trong từng giai đoạn nghiên cứu.

Nghiên cơ sở lý thuyết: Cơ sở lý luận của kiểm tra đánh giá trong dạy học, lý

thuyết ứng đáp câu hỏi. Nghiên cứu những tài liệu về kĩ thuật viết câu hỏi thi. Nghiên

cứu về các phần mềm phân tích đánh giá kết quả thi đặc biệt là phần mềm Conquest.

Xây dựng mô hình nghiên cứu: Nghiên cứu cơ sở lý thuyết của lý thuyết khảo

thí hiện đại (IRT). Xây dựng ma trận đề thi và viết các câu hỏi thi. Dùng phần mềm

Conquest để phân tích các câu hỏi thi.Từ đó định chuẩn một đề thi mẫu và có các đánh

giá phân tích sơ bộ các tham số đặc trƣng: Độ khó, độ sai biệt, độ tin cậy.

Thực nghiệm: Thực nghiệm lấy mẫu, nhằm đánh giá đề kiểm tra trắc nghiệm

khách quan về độ tin cậy, độ giá trị và tính khả thi của nó. Phân tích đánh giá chất

lƣợng của đề thi.

6. Giới hạn và phạm vi nghiên cứu

Xây dựng và phân tích một đề thi môn toán lớp 12 và phân tích một đề thi môn

toán bằng phần mềm Conquest.

7. Cấu trúc của luận văn

Ngoài phần mở đầu, phần kết luận, khuyến nghị, luận văn gồm 3 phần sau:

Chƣơng 1: Cơ sở lý luận và tổng quan vấn đề nghiên cứu

Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi

Chƣơng 3: Kết quả nghiên cứu

5

CHƢƠNG 1

CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU

1.1. Tổng quan về đo lƣờng trong giáo dục

Cùng với xu hƣớng chung là đổi mới nội dung và phƣơng pháp giảng dạy trong

nhà trƣờng. Đo lƣờng, đánh giá trong giáo dục là một quá trình quan trọng, quyết định

sự thành bại của quá trình đổi mới đó. Đo lƣờng trong giáo dục là công cụ để xác định

năng lực nhận thức ngƣời học, điều chỉnh quá trình dạy học, điều chỉnh nội dung,

phƣơng tiện hỗ trợ quá trình dạy học nhằm đạt đƣợc đƣợc các mục tiêu, mục đích giáo

dục đề ra. Đổi mới phƣơng pháp, nội dung dạy học đƣợc chú trọng để đáp ứng những

yêu cầu mới của mục tiêu giáo dục. Do vậy việc kiểm tra, đánh giá phải phải theo sát

quá trình giảng dạy và mục tiêu giáo dục đề ra.

Hầu hết các đại lƣợng tâm lý là các thuộc tính của tƣ duy, mà tƣ duy thì không

thể quan sát trực tiếp (đại lƣợng ẩn), nhƣng vẫn có thể đo một cách gián tiếp thông qua

các hành vi có thể quan sát đƣợc của con ngƣời. Ví dụ: để biết một học sinh có nắm

đƣợc nội dung của môn học hay không sau khi học xong môn học đó, một bài kiểm tra

có thể cho chúng ta biết một cách chính xác: học sinh đó hiểu đến mức nào (chỉ nhận

biết khái niệm một cách máy móc hay còn có khả năng đánh giá, chuyển giao nhận

thức của mình). Các công cụ đo lƣờng, quan sát (ví dụ bài kiểm tra) cần đƣợc thiết kế

cẩn thận, có độ tin cậy cao để ghi nhận chính xác các hành vi, làm cơ sở để xác định

đại lƣợng ẩn. Đo lƣờng nói chung đòi hỏi độ chính xác và chính xác, vì kết quả đƣợc

hỗ trợ để có ý nghĩa đủ để cung cấp thông tin đáng tin cậy cho các hình thức ra quyết

định khác nhau.

1.1.1. Các khái niệm cơ bản về đo lường đánh giá

Đo lƣờng là quá trình mô tả mức độ cá nhân đạt đƣợc (hay đã có) một đặc điểm

nào đó (nhƣ khả năng, thái độ,…) đƣợc ƣớc lƣợng bằng những con số cụ thể. Ví dụ:

Học sinh X làm bài kiểm tra đạt điểm 8. Học sinh Y làm đƣợc 3/4 số điểm tối đa của

bài thi trắc nghiệm Toán. Bài của học sinh M đƣợc xếp hạng k trong lớp. Các điểm số

8, 3/4 hay thứ hạng k là những ký hiệu gián tiếp chỉ ra khả năng của học sinh về mặt

định tính hay định hạng [4, tr. 352 - 353]. Đo lƣờng thành quả học tập là lƣợng giá

6

mức độ đạt đƣợc các mục tiêu cuối cùng (terminal) hay tiêu chí (criterion) trong một

khóa học, một giai đoạn học.

Trắc nghiệm là một dụng cụ hay một phƣơng thức hệ thống nhằm đo lƣờng

thành tích của một cá nhân so với các cá nhân khác hay so với những yêu cầu, nhiệm

vụ học tập đã đƣợc dự kiến. Trong lĩnh vực giáo dục, thƣờng dùng chữ “trắc nghiệm

thành quả học tập” hay “trắc nghiệm thành tích”. Trong trƣờng học, từ “trắc nghiệm”

đƣợc dùng nhƣ là một hình thức kiểm tra, đánh giá học sinh. “Trắc nghiệm khách

quan”, không phải hiểu theo nghĩa đối lập với một đo lƣờng chủ quan nào, mà nên

hiểu là hình thức kiểm tra này có tính khách quan cao hơn cách kiểm tra, đánh giá

bằng luận đề (hình thức kiểm tra tự luận) chẳng hạn. Các điểm số thu thập đƣợc từ một

bài trắc nghiệm thành tích có thể cung cấp hai loại thông tin: (1) loại thứ nhất là mức

độ ngƣời học thực hiện đƣợc tiêu chí đã đƣợc ấn định, chẳng hạn nhƣ giải đƣợc đúng

một bài Toán thông kê mô tả, giải thích đúng các kết xuất (output) của một chƣơng

trình thống kê v.v., không cần biết ngƣời ấy làm giỏi hơn hay kém hơn những ngƣời

khác, (2) loại thứ hai là sự xếp hạng tƣơng đối của các cá nhân liên quan đến mức độ

thực hiện của họ về bài trắc nghiệm đã ra, chẳng hạn học viên A có thể giải các bài

toán nhanh hơn, hoặc giỏi hơn học viên B. – [4, tr. 364 - 366].

Kiểm tra là một hoạt động nhằm cung cấp những số liệu, những thông tin làm

cơ sở cho việc giám sát, đánh giá. Kiểm tra là một phần của quá trình dạy học và có

ảnh hƣởng đến cuộc đời của tất cả học sinh. Vì vậy giáo viên cần quan tâm đến những

yếu tố ảnh hƣởng đến việc kiểm tra nhƣ: đề thi phải rõ ràng, phù hợp với mục đích

kiểm tra, phải đọc và kiểm tra nhiều lần để không có những sai sót; phía học sinh

không bị mất tập trung chú ý trong suốt thời gian làm bài.

Lƣợng giá là đƣa ra những thông tin ƣớc lƣợng về trình độ, năng lực, phẩm

chất của một cá nhân, một sản phẩm, v.v, dựa trên các số đo cụ thể hoặc quan sát

đƣợc. Trong dạy học, dựa vào các điểm số một học sinh đạt đƣợc, ngƣời thầy giáo

(hay nhà quản lý giáo dục) có thể ƣớc lƣợng trình độ kiến thức, kỹ năng kỹ xảo của

học sinh đó. Ví dụ: học sinh A hoàn thành xong 2/3 bài thi toán đại số đƣợc lƣợng giá

là thuộc loại trung bình.

7

Đánh giá là quá trình thu thập, điều tra, phân tích và giải thích thông tin một

cách có chủ đích, hệ thống nhằm xác định mức độ đạt đến các mục tiêu đã đề ra. Nhƣ

vậy, số đo cung cấp cho ta số liệu dùng để đánh giá, còn việc suy đoán, diễn giải

những con số này biến chúng thành sự đánh giá. Ta có thể nói thêm về đánh giá nhƣ

sau: Đánh giá là một quá trình trong đó ta đƣa ra những giá trị hoặc ấn định những giá

trị cho một cái gì dó. Đặc điểm quan trọng của sự đánh giá đó là khả năng xét đoán.

Đánh giá thƣờng mang tính định lƣợng. Nó dựa trên những con số hoặc các tỉ lệ phần

trăm. Sự xét đoán khi đánh giá gắn với một giá trị (định lƣợng) hay sự mô tả định tính

căn cứ vào số đo trên một bài kiểm tra. Đánh giá là một quá trình gồm hai bƣớc. Bƣớc

thứ nhất đó là kiểm tra, trong đó số liệu thu thập từ việc sử dụng một hoặc một chuỗi

các bài kiểm tra. Khi việc kiểm tra đƣợc thực hiện thì sự xét đoán cũng đƣợc thực hiện

về trình độ, thƣờng là trong bối cảnh các mục đích có hƣớng dẫn.

Tin cậy: Độ tin cậy của một dụng cụ đo là khái niệm cho biết mức độ ổn định,

vững chãi của các kết quả đo đƣợc khi tiến hành đo vật thể đó nhiều lần. Thí dụ có một

gói mứt khi đặt lên cân, lần đầu báo 750 gam sang lần thứ hai báo 735 gam, lần thứ ba

báo 765 gam, v.v… Ta nói cái cân này tin cậy. Tƣơng tự một bài trắc nghiệm đƣợc gọi

là tin cậy khi một học sinh làm nhiều lần bài trắc nghiệm này vào những thời điểm

cách xa nhau thì các kết quả điểm số thu đƣợc đều khá ổn định (các điểm số của các

lần đo không chênh lệch qua nhiều). Độ tin cậy thƣờng đƣợc biểu hiện bằng một con

số trong khoảng từ 0 đến 1. Độ lớn càng gần với 1 thì dụng cụ càng tin cậy. Ví dụ:

nếu từ 0.80 trở lên thì độ tin cậy đƣợc gọi là cao từ 0.40 đến 0.79 thì tƣơng đối tin cậy,

dƣới 0.40 là tin cậy thấp.

Giá trị: Độ giá trị của một dụng cụ đo là một khái niệm chỉ ra rằng dụng cụ này

có khả năng đo đúng đƣợc cái cần đo. Thí dụ: Một vật có trọng lƣợng thực là 800 gam.

Nếu khi bỏ lên cân thấy báo trị số 800 gam, ta nói cái cân này giá trị. Còn thấy báo là

700 gam, cân sẽ không giá trị vì không đo đúng đƣợc trọng lƣợng cần đo. Đặt vật lên,

xuống đế cân nhiều lần, lần nào kết quả cũng không xê dịch khỏi 700 gam, ta nói cân

đó tin cậy nhƣng không giá trị.

1.1.2. Các phương pháp đo lường trong giáo dục

8

Hiện nay ở Việt Nam đã biết đến một hệ thống phƣơng pháp và kỹ thuật đánh

giá khá phong phú. Về phƣơng pháp đánh giá có thể kể ra: quan sát, vấn đáp, viết.

Trong viết còn bao gồm nhiều hình thức nhƣ: trắc nghiệm tự luận (tự luận), trắc

nghiệm khách quan hay còn gọi là trắc nghiệm.

Theo [3] và ý kiến của các chuyên gia về đo lƣờng đánh giá, ta nên sử hình thức

kiểm tra tự luận để khảo sát thành quả học tập trong những trƣờng hợp dƣới đây:

(1) Khi nhóm học sinh dự thi hay kiểm tra không quá đông và đề thi chỉ đƣợc

sử dụng một lần, không dùng lại nữa.

(2) Khi thầy cô giáo cố gắng tìm mọi cách có thể đƣợc để khuyến khích và khen

thƣởng sự phát triển kỹ năng diễn tả bằng văn viết.

(3) Khi thầy giáo muốn thăm dò thái độ hay tìm hiểu tƣ tƣởng của học sinh về

một vấn đề nào đó hơn là khảo sát thành quả học tập của chúng.

(4) Khi giáo viên tin tƣởng vào tài năng phê phán và chấm bài luận đề một cách

vô tƣ và chính xác hơn là khả năng soạn thảo những câu trắc nghiệm thật tốt.

(5) Khi thời gian soạn thảo bài khảo sát không nhiều .

Mặt khác, ta nên sử dụng trắc nghiệm khách quan trong những trƣờng hợp sau:

(1) Khi ta cần khảo sát kết quả học tập của một số lƣợng lớn học sinh, hay

muốn rằng bài khảo sát ấy có thể sử dụng lại vào một lúc khác.

(2) Khi ta những điểm số chính xác khách quan, công bằng và nhanh chóng.

(3) Khi ta cần kiểm tra toàn diện kiến thức, ngăn ngừa gian lận thi cử.

Cả trắc nghiệm lẫn tự luận đều có thể sử dụng để:

(1) Đo lƣờng mọi thành quả học tập mà học sinh thu nhận đƣợc ở các mức độ

nhận thức.

(2) Khảo sát đƣợc các khả năng hiểu, suy nghĩ có phê phán, giải quyết các vấn

đề mới, phân tích, tổng hợp.

(3) Khuyến khích, gợi động cơ học tập để nắm vững kiến thức.

1.1.3. Đánh giá kết quả học tập của học sinh

9

Với từng môn học thì các mục tiêu trên đƣợc cụ thể hóa thành các mục tiêu về

kiến thức, kỹ năng và thái độ. Mục đích của giáo dục là sự tiến bộ của học sinh. Đây

chính là kết quả cuối cùng của quá trình học tập nhằm thay đổi hành vi của học sinh.

Khi nhìn nhận mục tiêu giáo dục theo hƣớng kết quả học tập, cần phải lƣu tâm rằng

chúng ta đang đề cập đến những sản phẩm của quá trình học tập chứ không phải bản

thân quá trình đó. Mối liên hệ giữa mục tiêu giáo dục (sản phẩm) và kinh nghiệm học

tập (quá trình) đƣợc thiết kế nhằm hƣớng tới những thay đổi hành vi theo nhƣ mong

muốn. Vậy đánh giá kết quả học tập là quá trình phản hồi thông tin, chất lƣợng giảng

dạy tới ngƣời quản lý, ngƣời dạy và ngƣời học.

Khoa học đánh giá ngày càng phát triển, các loại hình đánh giá kết quả học tập

của học sinh đƣợc phân loại theo các quan điểm tiếp cận mà có các loại hình đánh giá

sau: đánh giá trên diện rộng và đánh giá trên lớp học, đánh giá chẩn đoán, đánh giá

ban đầu, đánh giá trong tiến trình và đánh giá tổng kết. Ngoài ra xét theo mục tiêu học

tập sẽ có hai loại đánh giá là Assessment for Learning (Đánh giá để cải tiến việc học

tập) và Assessment of Learning (Đánh giá kết thúc giai đoạn học tập). Mỗi loại đánh

giá sẽ có mục đích đánh giá, phƣơng pháp đánh giá, công cụ đánh giá và các khuyến

nghị khác nhau.

1.1.4. Công cụ đo lường kết quả học tập

Hoạt động đánh giá đào tạo đƣợc ra đời và phát triển song song cùng với hoạt

động đào tạo. Việc lƣợng hóa giá trị kết quả học tập nhờ sử dụng hình thức thi trắc

nghiệm (test) là một công đoạn quan trọng trong quá trình dạy học. Trắc nghiệm theo

nghĩa rộng là một hoạt động đƣợc thực hiện để đo lƣờng năng lực của các đối tƣợng

nào đó nhằm những mục đích xác định, chẳng hạn, phân loại thí sinh, tìm ra thí sinh

nổi trội, sàng lọc ra những thí sinh chƣa đạt chuẩn. Trong giáo dục trắc nghiệm đƣợc

tiến hành thƣờng xuyên ở các kỳ thi, kiểm tra hay sát hạch nhằm đánh giá kết quả học

tập và giảng dạy đối với một phần của môn học hoặc toàn bộ môn học hay đối với cả

một cấp học. Ngoài ra trắc nghiệm cũng có thể đƣợc sử dụng nhằm lọc chọn một số

ngƣời có năng lực cao nhất vào học một khoá học nào đó. Hiện nay trong giáo dục phổ

thông có hai hình thức chủ yếu đo lƣờng kết quả học tập của học sinh là câu hỏi trắc

nghiệm tự luận gọi tắt là câu hỏi tự luận và câu hỏi trắc khách quan (TNKQ). Ta xem

xét hai hình thức thi dƣới bảng so sánh sau: 10

11

Bảng 1.1 So sánh ưu nhược điểm của đề thi TNKQ và tự luận

Ƣu điểm Chỉ mục TNKQ Tự luận

Ít tốn công ra đề thi x

x Đánh giá đƣợc khả năng diễn đạt, đặc biệt là diễn đạt tƣ duy hình tƣợng

Đề thi phủ kín nội dung môn học x

Ít may rủi do “học tủ” x

Ít tốn công chấm thi x

Khách quan trong chấm thi x

x Áp dụng đƣợc công nghệ mới trong việc nâng cao chất lƣợng kỳ thi, giữ bí mật đề thi, hạn chế quay cóp khi thi, hạn chế tiêu cực trong chấm thi và giúp phân tích kết quả thi.

Nắm vững bản chất từng phƣơng pháp cùng điều kiện cơ sở vật chất và công

nghệ triển khai cụ thể, để sử dụng hợp lí, tối ƣu mỗi phƣơng pháp. Theo [3, tr. 29 – 36]

ta có bảng so sánh ƣu nhƣợc điểm của các hình thức thi TL và TN nhƣ sau.

Bảng 1.2 Hình thức thi TNKQ và tự luận

Vấn đề Đề thi TNKQ Đề thi tự luận

Hình thức câu hỏi / đề thi

Một bộ câu hỏi trong đó mỗi câu hỏi đều kèm theo các phƣơng án trả lời cho sẵn để học sinh lựa chọn phƣơng án trả lời. Một bộ câu hỏi trong đó mỗi câu hỏi không kèm theo các phƣơng án trả lời mà học sinh phải tự luận để đƣa ra câu trả lời.

Khó soạn câu hỏi. Dễ soạn câu hỏi

Ít bị sai sót về diễn đạt, nội dung rõ ràng. Dễ sai về diễn đạt, nội dung câu hỏi thiếu chính xác (vì có nhiều câu hỏi nên khó rà soát).

Mức độ phức tạp khi viết câu hỏi và tổ hợp đề

Dễ chuẩn bị đáp án, hƣớng dẫn chấm. Khó xây dựng đáp án, hƣớng dẫn chấm, xây dựng đáp án phức tạp.

12

Có nhiều câu hỏi nên khó nhớ, dễ bảo mật. Khó bảo mật đề thi do có ít câu hỏi.

Tốn ít thời gian làm bài, đề kiểm tra có thể phủ toàn bộ chƣơng trình. Phải dành nhiều thời gian cho học sinh làm bài, khó kiểm tra toàn bộ chƣơng trình.

Tốn nhiều thời gian cho việc in ấn, nhân đề. Không tốn nhiều công sức in ấn đề. Mức độ phức tạp khi tổ chức thikiểm tra

Học sinh khó sử dụng tài liệu, loại trừ tiêu cực trong thi cử. Học sinh dễ quay cóp sử dụng tài liệu, tiêu cực trong thi cử.

Học sinh có thể đoán mò. Học sinh không đoán đƣợc câu trả lời đúng. Vấn đề đoán mò phƣơng án trả lời đúng

Độ tin cậy cao. Độ tin cậy thấp. Độ tin cậy của đề thi

Có thể đánh giá đầy đủ các mức nhận thức nếu các câu hỏi đƣợc soạn kỹ. Dễ đánh giá đƣợc các mức nhận thức cao (phân tích, tổng hợp, đánh giá).

Tính giá trị của đề thi

Bao quát toàn bộ chƣơng trình nên đánh giá chính xác hơn, có thể có độ giá trị cao hơn. Không bao quát toàn bộ chƣơng trình nên độ giá trị có thể không cao.

Chấm điểm khách quan, công bằng Chấm điểm phụ thuộc vào ý chủ quan của ngƣời chấm. Sự phức tạp của việc chấm điểm

Khó phân tích, đánh giá câu hỏi.

Mức độ phức tạp khi phân tích, đánh giá câu hỏi thi Có nhiều phần mềm để phân tích, đánh giá câu hỏi, lựa chọn những câu hỏi có chất lƣợng.

13

1.1.5. Sơ lược về khoa học đo lường đánh giá trên thế giới và Việt Nam.

1.1.5.1. Sơ lược về khoa học đo lường đánh giá trên thế giới

Lý thuyết trắc nghiệm đã đƣợc xây dựng và đƣa vào ứng dụng trong các trƣờng

đại học ở Mỹ và một số nƣớc khác từ khá sớm (bắt đầu từ những năm 1920). Lý thuyết

trắc nghiệm là cơ sở khoa học giúp đánh giá chất lƣợng của bài thi trắc nghiệm (thông

qua đánh giá các câu hỏi) và ƣớc lƣợng năng lực thí sinh (thông qua việc thí sinh trả

lời các câu hỏi). Lĩnh vực khoa học đo lƣờng phát triển mạnh ở Mĩ vào thời kỳ từ

trƣớc và sau thế chiến thứ hai với những dấu mốc quan trọng nhƣ trắc nghiệm trí tuệ

Stanford-Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập tổng hợp đầu

tiên Stanford Achievement Test ra đời vào năm 1923. Cho đến nay có hai hệ lý luận

chính dùng trong lý thuyết đo lƣờng giáo dục, đó là: lý thuyết trắc nghiệm cổ điển

(Classical Test Theory - CTT); lý thuyết ứng đáp câu hỏi (Item Response Theory -

IRT). IRT ra đời sau CTT và hiện nay trên thế giới IRT đƣợc áp dụng rộng rãi trong

các hệ thống đánh giá giáo dục, đặc biệt là ở Mỹ, Australia và một số nƣớc phát triển

khác.

Hai cách tiếp cận thống kê về lý thuyết đo lƣờng, thƣờng đƣợc gắn nhãn nhƣ là

"cổ điển" và "hiện đại" (lý thuyết ứng đáp câu hỏi) (Gustaffson 1977, Crocker và

Algina 1986). Mặc dù chúng tƣơng đối khác nhau, nhƣng không nên xem chúng nhƣ

các đối thủ bởi chúng bổ sung các ƣu nhƣợc điểm cho nhau. Có lẽ vấn đề khác biệt có

thể đƣợc hiểu là sự phụ thuộc vào mẫu và so bằng của bài kiểm tra cổ điển. Điểm số

đƣợc tính trên cơ sở các thủ tục phân tích cổ điển cung cấp thông tin về khả năng của

thí sinh chỉ ở một mức độ hạn chế. Ngoài ra, vì kiểm tra các đặc tính của thí sinh đƣợc

xác định trên cơ sở hồi đáp của một tập hợp học sinh, chỉ có thể đƣợc tái sử dụng với

cùng một tập học sinh đó hoặc với một tập học sinh mới có những đặc điểm tƣơng

đồng với tập học sinh đã cho - một trở ngại lớn trong cách hiệu quả xây dựng ngân

hàng câu hỏi.

Bên cạnh về sự nghiên cứu và phát triển của lý thuyết khảo thí cổ điển (CTT)

những năm đầu thế kỉ 20 ở châu Âu và Mỹ, từ thập niên 50 những công trình đầu tiên

về lý thuyết khảo thí hiện đại (IRT) đã đƣợc công bố. Allen Birnbaum đã viết một loạt

các báo cáo kỹ thuật về các mô hình và mô hình kiểm tra đánh giá tham số vào năm

14

1957 và 1958. George Rasch (1960) xuất bản cuốn sách của ông đề xuất một số mô

hình cho ứng đáp câu hỏi. Trong những năm 1960, nhiều công việc trong lĩnh vực này

đã đƣợc đóng góp bởi Baker (1961) về so sánh thực nghiệm giữa các tiêu chí của bài

thi. Có thể kể ra và Novick (1968), và Wright (1968) đã làm việc trên các mô hình nhị

phân. Samejima đề xuất mô hình đa phân trong năm 1969. Nhóm học giả này đã mang

lại các kết quả đáng kể trong lĩnh vực này. Thông qua những năm 1970 và 1980, một

nhóm học giả mới nổi lên bao gồm Aldrich (1978), Anderson (1977, 1980),

Hambleton và Swaminathan (1986), Wright and Stone (1979), Swaminathan và

Rogers (1981), và Harris (1989). Cũng có những đóng góp quan trọng cho lý thuyết

khảo thí hiện đại. [B4]. Vào những năm 2000, lĩnh vực IRT đã đƣợc thúc đẩy bởi một

làn sóng các nhà nghiên cứu mới, những ngƣời không chỉ mở rộng các khía cạnh lý

thuyết (dự toán, xác định mô hình, và sự phù hợp), mà còn nâng cao các khía cạnh tính

toán và ứng dụng của nó. Nghiên cứu sâu rộng về IRT trong 50 năm qua năm đã đƣợc

thể hiện bằng sự gia tăng số lƣợng các gói phần mềm đƣợc thiết kế để phân tích câu

hỏi dữ liệu phản hồi từ các khảo sát hoặc kiểm tra. Nhiều phần mềm thƣơng mại khác

của IRT cũng đƣợc tạo ra nhƣ BILOG, MULTILOG, WINSTEPS, IRTPRO, MPLUS,

QUEST, CONQUEST và HLM, là các ví dụ. Quan trọng hơn nữa là một số gói IRT đã

đƣợc phát triển trong phần mềm mã nguồn mở R để ƣớc tính các mô hình IRT khác

nhau cũng xuất hiện và đã đƣợc công nhận. Bao gồm các gói ltm cho IRT không giới

hạn ((Rizopoulos, 2006), eRm cho các mô hình Rasch mở rộng (Mair & Hatzinger,

2007), mlirt cho đánh giá đa cấp và Bayesian của một số mô hình IRT (Fox, 2007),

gpcm (Johnson, 2007) cho một dự toán Bayesian của mô hình tín dụng một phần tổng

quát, MCMCpack cho Bayesian IRT (Martin, Quinn, & Park, 2011), và mirt cho IRT

đa chiều (Chalmers, 2012). De Boeck (2008) và Wilson (2008) đã sử dụng gói thống

kê chung lme4 và kết hợp các mô hình Rasch theo mô hình hỗn hợp tuyến tính tổng

quát. Điều này làm cho có thể sử dụng SAS PROC NLMIXED (SAS Institute Inc.)

cho IRT.

Bƣớc ngoặt cho sự phát triển nở rộ là ý tƣởng thay mô hình dạng vòm chuẩn mà

Birnbaum và Lord đề xuất cho hàm đặc trƣng câu hỏi bằng mô hình logistic mà

George Rasch đề xuất. Từ đây các khó khăn về mô hình toán học trong IRT đƣợc tháo

gỡ. Trên cơ sở IRT công nghệ trắc nghiệm thích ứng nhờ máy tính (Computer

15

Adaptive Test – CAT) ra đời. Ngoài ra, trên cơ sở những thành tựu của IRT, công

nghệ E-RATE chấm tự động các bài tự luận tiếng Anh nhờ máy tính của ETS đã đƣợc

triển khai nhờ mạng Internet trong nhiều năm qua. Hiện nay một số nƣớc Nhật, Thái

Lan, Trung Quốc ... bƣớc đầu áp dụng lý thuyết IRT vào các kì thi diện rông của mình.

16

1.1.5.2. Ứng dụng trắc nghiệm ở Việt Nam

Khoa học về đo lƣờng và đánh giá trong giáo dục ở nƣớc ta thực sự chƣa đƣợc

quan tâm đúng mức. Trƣớc đây do chiến tranh, nên các chuyên gia về đo lƣờng đánh

giá ở miền Bắc gần nhƣ không có. Trƣớc năm 1975, ở Miền Nam nƣớc ta có một vài

ngƣời đƣợc đào tạo bài bản về đo lƣờng đánh giá nhƣ GS. Dƣơng Thiệu Tống. Những

năm 90 bộ giáo dục đã bƣớc đầu có định hƣớng gửi đi đào tạo các nƣớc phát triển các

chuyên gia về đo lƣờng đánh giá, nhƣng số lƣợng còn quá ít. Hiện nay ngay trong một

số trƣờng sƣ phạm môn đo lƣờng đánh giá vẫn chƣa đƣợc giảng dạy nhƣ một môn học

chính khóa. Các sách viết về khoa học đo lƣờng cho đến nay chủ yếu của hai giáo sƣ

GS. Dƣơng Thiệu Tống và GS. Lâm Quang Thiệp. Các cuốn sách này tƣơng đối hàn

lâm với đa số ngƣời đọc và giáo viên. Tuy nhiên những năm gần đây các hội thảo,

khóa học ngắn về đo lƣờng đánh giá đã đƣợc các trƣờng đại học, bộ giáo dục tổ chức

thƣờng xuyên nhằm từng bƣớc “xóa mù”, phổ cập cho giáo viên và các nhà quản lý

giáo dục. Các kì thi trung học phổ thông quốc gia chuyển dần sang hình thức thi trắc

nghiệm và ứng dụng khoa học khảo thí vào công việc thiết kế, xây dựng, phân tích đề

thi. Đây là một vấn đề khoa học tƣơng đối mới nên đôi ngũ nghiên cứu, đào tạo làm

chuyên môn về khỏa thí hiện đại chƣa nhiều chủ yếu các nhóm nghiên cứu nằm trong

trƣờng hoặc liên quan đến ĐHQG HN.

17

1.2. Lý thuyết đánh giá cổ điển

Mặc dù IRT đã đƣợc nghiên cứu trong 50 năm qua, CTT vẫn đƣợc nghiên cứu

và áp dụng liên tục. Nhiều chƣơng trình thử nghiệm vẫn còn thực hiện CTT trong thiết

kế và đánh giá kết quả kiểm tra. Điều này là do một số lợi thế CTT so với IRT. Ví dụ,

CTT mô tả mối quan hệ giữa điểm số thực và điểm quan sát theo một cách tuyến tính

làm cho mô hình CTT dễ hiểu và áp dụng nhiều nhà nghiên cứu. Nó dựa hoàn toàn vào

tổng số điểm hoặc điểm số của chính các câu trả lời. Điểm quan sát của thí sinh là tổng

số điểm đạt đƣợc của mỗi thí sinh và nó khác với điểm số thực sự của một điểm số lỗi

thông thƣờng. Phƣơng pháp tính điểm này đã tạo ra một số lợi thế cũng nhƣ hạn chế.

Lợi thế đầu tiên của CTT là các phân tích yêu cầu kích cỡ mẫu nhỏ hơn IRT. Thứ hai,

CTT thủ tục toán học đơn giản hơn nhiều so với IRT, vì các mô hình trong CTT là

tuyến tính trong khi các mô hình của IRT là phi tuyến. Thứ ba, mô hình tham số ƣớc

tính trong CTT là khái niệm đơn giản và đòi hỏi tối thiểu giả định, làm cho các mô

hình hữu ích và áp dụng rộng rãi. Thứ tƣ, các phân tích không yêu cầu sự nghiêm

chỉnh của các nghiên cứu phù hợp nhƣ trong IRT. Tuy nhiên, CTT có một vài nhƣợc

điểm lớn. Nền tảng của nhiều phân tích CTT là các đặc tính của các bài kiểm tra khó

khăn và độ tin cậy. Các chỉ số này đƣợc đo bằng tỷ lệ của phần %, p, của ngƣời kiểm

tra, ngƣời mà trả lời câu hỏi một cách chính xác và tổng số câu hỏi tƣơng quan, r: Tuy

nhiên, các chỉ số không liên tục vì chúng hoàn toàn phụ thuộc vào mẫu của thí sinh

đƣợc lấy. Không thể sử dụng chúng để chỉ ra đặc trƣng hoặc chất lƣợng của một bài

kiểm tra. Một nhƣợc điểm nữa đó là điểm thi của thí sinh đƣợc kiểm chứng. Nghĩa là,

thí sinh có thể đạt đƣợc điểm cao hơn trên một bài kiểm tra dễ dàng hơn và điểm thấp

hơn trên một khó kiểm tra, và do đó không có điểm số thực sự có thể đƣợc trích xuất.

Điều này không cho phép một cơ sở để kết hợp bài kiểm tra và mức độ khả năng. Theo

nghĩa này, IRT có nhiều lợi ích hơn CTT. Trong khung IRT, các đặc điểm của mục là

độc lập mẫu và điểm tiềm ẩn của một cá nhân đƣợc kiểm tra độc lập với điều kiện là

các mô hình đƣợc lựa chọn phù hợp với dữ liệu. Vì vậy, điểm số mô tả trình độ thí

sinh không phụ thuộc vào số lƣợng cũng nhƣ năng lực của mẫu thử nghiệm. Điểm số

của họ có thể thấp hơn khi các bài kiểm tra khó hơn và cao hơn các bài kiểm tra dễ

dàng hơn nhƣng điểm số về khả năng của chúng vẫn không đổi so với bất kỳ bài kiểm

tra nào tại thời điểm thử nghiệm hoặc khảo sát. IRT cũng cho phép tính toán xác suất

18

của một ngƣời trả lời cụ thể chọn một trên một câu hỏi kiểm tra. Các bài kiểm tra mẫu

độc lập tạo điều kiện thuận lợi cho việc thiết kế bài kiểm tra thích nghi trên máy tính,

cho phép so sánh chính xác hơn hoặc xác định rõ năng lực ngƣời kiểm tra. Hơn nữa,

IRT có thể đƣợc sử dụng để sàng lọc quy mô lớn hoặc rời rạc, vì nó có khả năng tính

toán tiêu chuẩn lỗi và do đó cung cấp thông tin về chất lƣợng của mỗi câu hỏi thi. Hỗ

trợ này với việc làm quyết định lựa chọn các câu hỏi để loại trừ hoặc đƣa vào một câu

hỏi kiểm tra trong bài thi. Ngoài ra, các câu hỏi cũng đƣợc lựa chọn dựa trên các chỉ số

độ khó, độ phân biệt của câu hỏi, nghĩa là khả năng của họ phân biệt các nhóm có đặc

điểm tiềm ẩn thấp và cao. Mặc dù có những ƣu điểm, các mô hình IRT cũng có những

thiếu sót hạn chế của nó. Về mặt kỹ thuật, các mô hình thƣờng quá phức tạp hơn và

các phƣơng pháp ƣớc lƣợng tham số thƣờng liên quan đến phƣơng pháp số, các công

thức toán học. Các đặc điểm tiềm ẩn cũng nhƣ các thông số của câu hỏi thi cũng có thể

khó giải thích cả bằng đồ họa và số. Do vậy mà mô hình CTT vẫn đƣợc nghiên và

dùng phổ biến hiện nay. Để nắm chắc về lý thuyết khảo thí cổ điển chúng ta cần biết rõ

về các khái niệm thống kê, các đặc trƣng của câu hỏi trắc nghiệm,…

1.2.1. Các tham số đặc trưng của cầu hỏi trắc nghiệm và phân tích đề trắc nghiệm

1.2.1.1. Công thức tính độ khó của câu trắc nghiệm.

Đề thi đƣợc cho là dễ khi tỉ lệ học sinh làm đúng trên tổng số thí sinh dự thi là

một số gần bằng 1, ngƣợc lại, khi tỉ lệ này gần bằng 0. Từ ý tƣởng đó, ngƣời ta đi đến

công thức tính độ khó của câu trắc nghiệm nhƣ sau:

Số ngƣời trả lời đúng câu i

Độ khó của câu i =

Tổng sổ ngƣời làm bài trắc nghiệm

Khi nào độ khó của câu trắc nghiệm (TN) bằng 0? Khi nào độ khó của câu TN

bằng 1? Nhƣ vậy độ khó của câu TN có thể có những giá trị từ bao nhiêu đến bao

nhiêu? Độ khó càng gần 0 thì câu TN càng khó. Độ khó càng gần 1 thì câu TN càng

dễ. Thực ra độ khó ở đây đƣợc hiểu là năng lực thực hiện câu hỏi của TS.

1.2.1.2. Xác định độ khó vừa phải của câu trắc nghiệm

19

Để có thể kết luận đƣợc rằng một câu TN là dễ, khó hay vừa sức học sinh (HS),

trƣớc hết ta phải tính độ khó của câu TN ấy rồi so sánh với độ khó vừa phải (ĐKVP)

của loại câu TN ấy.

- Nếu độ khó của câu TN > ĐKVP thì ta kết luận rằng câu TN ây là dễ so với

trình độ HS lớp làm trắc nghiệm.

- Nếu độ khó của câu TN < ĐKVP, thì ta kết luận rằng câu TN ấy là khó so với

trình độ HS của lớp làm trắc nghiệm.

- Nếu độ khó của câu TN xấp xỉ với ĐKVP, thì ta kết luận rằng câu TN vừa sức

với trình độ HS của lớp làm trắc nghiệm.

Ta có thể biểu diễn điều ấy trên một trục hoành nhƣ sau:

ĐKVP

Câu TN khó Câu TN vừa Câu TN dễ

Nhƣng làm cách nào để tính đƣợc ĐKVP của câu TN?

Công thức tính ĐKVP:

100% + % may rủi

Độ khó vừa phải câu i =

Mỗi loại câu TN có tỉ lệ % may rủi khác nhau. Loại câu đúng- sai có tỉ lệ %

may rủi là 50%, loại câu có 4 lựa chọn có tỉ lệ % may rủi là 25%, loại câu có 5 lựa

chọn có tỉ lệ % may rủi là 20%. Từ đó bạn hãy tính độ khó vừa phải của từng loại câu

TN và nếu bạn có đƣợc độ khó của một câu TN, thì bạn có thể kết luận đƣợc rằng câu

TN ấy là khó hay dễ so với trình độ HS lớp làm trắc nghiệm.

1.2.1.3. Độ phân biệt của câu hỏi

Độ phân biệt của một câu TN là một chỉ số giúp ta phân biệt đƣợc HS giỏi với

HS kém. Cho nên, một bài TN gồm toàn những câu TN có độ phân cách tốt trở lên sẽ

là một công cụ đo lƣờng có tính tin cậy cao. Nhƣng làm cách nào để tính đƣợc độ phân

20

cách của câu TN? Sau khi đã chấm và cộng tổng điểm của từng bài TN, ta có thể thực

hiện các bước sau để biết được độ phân cách của một câu TN:

Bước 1: Xếp đặt các bài làm của học sinh (đã chấm, cộng điểm) theo thứ tự

tổng điểm từ cao đến thấp.

Bước 2: Căn cứ trên tổng số bài TN, lấy 27% của tổng số bài làm có điểm từ bài

cao nhất trở xuống xếp vào nhóm CAO và 27% tổng số bài làm có điểm từ bài thấp

nhất trở lên xếp vào nhóm THẤP.

Bước 3: Tính tỉ lệ phần trăm học sinh làm đúng câu TN riêng cho từng nhóm

(CAO, THẤP) bằng cách đếm số ngƣời làm đúng trong mỗi nhóm và chia cho số

ngƣời của nhóm (lƣu ý: số ngƣời mỗi nhóm = 27% tổng số bài làm học sinh).

Bước 4: Tính độ phân cách câu (D) theo công thức: D = Tỉ lệ % nhóm cao làm

đúng câu TN - Tỉ lệ % nhóm thấp làm đúng câu TN

Lặp lại các bƣớc 3 và 4 cho mỗi câu trắc nghiệm khác.

Chú thích: Có thể tính độ phân cách của một câu trắc nghiệm theo cách tƣơng

đƣơng: Thực hiện bƣớc 1 và 2 nhƣ mô tả trên. Trong bƣớc 3 đếm số ngƣời làm đúng

trong mỗi nhóm, gọi là Đúng (CAO) và Đúng (THẤP). Sau đó thay vào công thức

(bƣớc 4):

Đúng (Cao) - Đúng (Thấp)

Độ phân cách câu i = x 100%

Sỗ ngƣời trong 1 nhom

Theo công thức tính độ phân cách ở phần 2, độ phân cách của một câu TN nằm

trong giới hạn từ -1.00 đến +1.00. Để có thể đƣa ra kết luận sau khi tính đƣợc độ phân

cách của một câu TN, ta căn cứ vào quy định sau:

* D ≥ 0.40. Câu TN có độ phân cách rất tốt.

*0.30 ≤ D ≤0.39. Câu TN có độ phân cách khá tốt nhƣng có thể làm cho tốt hơn.

*0.20 ≤ D ≤0.29. Câu TN có độ phân cách tạm đƣợc, cần phải điều chỉnh.

* D ≤0.19. Câu TN có độ phân cách kém cần phải loại bỏ hay phải sửa chữa nhiều.

1.2.1.4. Phân tích đề thi

21

a) Phân tích đáp án: Đáp án là lựa chọn đƣợc xác định là ĐÚNG NHẤT trong số các

lựa chọn của phần trả lời câu MCQ (hoặc là giá trị ĐÚNG của mệnh đề trong câu

Đúng - Sai). Một câu hỏi tốt nếu số ngƣời trả lời đúng ở nhóm cao hơn số ngƣời trả lời

đúng ở nhóm thấp. Một câu hỏi có độ phân biệt tốt là tỉ lệ % số ngƣời ở nhóm cao

chọn đáp án phải nhiều hơn số ngƣời ở nhóm thấp chọn đáp án từ 40% trở lên.

b) Phân tích mồi nhử: Khác với đáp án, mồi nhử là những lựa chọn đƣợc xác định là

SAI trong phần trả lời. Chúng đƣợc tập hợp từ những câu trả lời sai trong bài làm của

nhiều HS khi làm những câu hỏi dạng luận đề giáo viên đặt.

Vì vậy, một mồi nhử đƣợc gọi là tốt khi HS thuộc nhóm CAO ít chọn nó, còn

HS thuộc nhóm THẤP chọn nó nhiều hơn, nghĩa là sự chênh lệch số ngƣời chọn (hoặc

tỉ lệ%) của hai nhóm là lớn. Để làm rõ hơn ý vừa nói, ta hãy phân tích đáp án và mồi

nhử của câu 1.

Bảng 1.3 Mô tả câu nhóm các câu hỏi trắc nghiệm

Câu 1 A B* C D Không trả lời TC

Nhóm cao 0 10 1 0 0 11

Nhóm thấp 1 7 2 1 0 11

Ghi chú: B* là đáp án.

Nhân xét các lựa chọn câu 1: Quan sát các mồi nhử A, C, D ta thấy số ngƣời ở

nhóm thấp chọn nhiều hơn số ngƣời ở nhóm cao nhƣng mức độ chênh lệch không

nhiều, cho nên ta có thể nhận định đầy là những mồi nhử chƣa tốt lắm. Thêm vào đó, tỉ

lệ % số ngƣời ở nhóm cao chọn đáp án B hơn tỉ lệ % số ngƣời ở nhóm thấp chọn đáp

án B chỉ có 27% nên độ phân cách của câu này không cao. Ta hãy xem lại nội dung cụ

thể của câu trắc nghiệm số 1 này (đáp án = B):

1.2.1.5. Một số tiêu chuẩn để chọn câu trắc nghiệm

Khi chọn câu TN đƣợc chọn (lƣu vào ngân hàng đề) ta cần chú ý:

(1). Những câu TN có độ khó quá thấp hay quá cao, đồng thời có độ phân cách

âm hoặc quá thấp là những câu kém cần phải xem lại để loại đi hay sửa chữa lại.

22

(2). Với đáp án trong câu TN, số ngƣời nhóm cao chọn phải nhiều hơn số ngƣời

nhóm thấp.

(3). Với các mồi nhử, số ngƣời trong nhóm cao chọn phải ít hơn số ngƣời trong

nhóm thấp.

Dựa và các tiêu chí trên chúng ta hoàn toàn có thể xây dựng đƣợc các đề trắc

nghiệm chất lƣợng. Tuy nhiên nhƣ đã phân tích ở phần trƣớc. Với các mẫu thay đổi,

thì các tham số đặc trƣng của câu hỏi (độ khó, độ phân biệt,..) cũng thay đổi theo. Nên

trong lý thuyết CTT vẫn đề chọn mẫu là rất quan trọng.

1.2.2. Điểm số học tập

1.2.2.1. Điểm thô (raw scores)

Điểm số trên một bài thi (bài tự luận, bài trắc nghiệm lớp học hay bài trắc

nghiệm đƣợc tiêu chuẩn hóa) thƣờng đƣợc xác định bởi điểm của mỗi câu. Bài tự luận,

điểm số một câu hỏi có thể lớn hơn 1, trong đó một số ý đặc trƣng trong câu trả lời

đƣợc cho điểm theo một thang điểm đã định trƣớc. Với bài trắc nghiệm, mỗi câu hỏi

chỉ có thể quy về đúng hay sai. Câu trả lời đúng thƣờng đƣợc tính là 1 điểm. Tổng

cộng các điểm số từng câu trắc nghiệm đƣợc gọi là điểm thô. Ta thấy điểm thô của bài

trắc nghiệm không giúp ta so sánh giữa các bài trắc nghiệm có độ khó khác nhau. Vì

vậy thƣờng phải đổi điểm thô thành các loại điểm khác phù hợp với việc nghiên cứu,

trình bày và giải thích. Hiện nay ở nƣớc ta áp dụng điểm từ 0 đến 10.

1.2.2.2. Điểm phần trăm đúng

Điểm số này tính bằng tỉ lệ phần trăm, theo công thức: X = 100 Đ/T. Trong đó:

X = điểm tính theo tỉ lệ %;

Đ = số câu học sinh làm đúng;

T = tổng số câu của bài trắc nghiệm.

Điểm phần trăm đúng so sánh điểm của học sinh này với điểm số tôi đa có thể

đạt đƣợc. Đây là một loại điểm tuyệt đối. Yếu tố xác định điểm số này là độ khó của

nội dung bài trắc nghiệm, cần thận trọng khi sử dụng nó, vì dễ bị chủ quan của ngƣời

ra đề và thƣờng không đo lƣờng đƣợc mức khả năng thực của học sinh. Bởi vì ngƣời

ra đề thi có thể thay đổi số câu trắc nghiệm dễ hay khó tùy theo ý muốn.

23

1.2.2.3. Điểm chữ

Về căn bản cũng giống nhƣ điểm phần trăm đúng, điểm chữ dùng các mẫu tự A,

B, C, D, v.v… và có thể ấn định: điểm A gồm các điểm phần trăm đúng từ 90 đến 100,

điểm B gồm các điểm phần trăm đúng từ 70 đến 89, điểm C gồm các điểm phần trăm

đúng từ 50 đến 69, v.v….

24

1.2.2.4. Thứ hạng bách phân (Percentile Ranks, thường viết là PR)

Đây là điểm có đƣợc do sự biến đổi các điểm thô ra thành các trị số phần trăm

trong một nhóm chọn làm chuẩn mực.

a) Định nghĩa: Thứ hạng bách phân là một con số nằm giữa 0 và 100, cho biết có bao

nhiêu phần trăm trƣờng hợp điểm số trong nhóm chuẩn mực rơi vào chính điểm số ấy

hay ở dƣới nó.

b) Ý nghĩa: Dùng điểm PR có thể so sánh điểm của các học sinh làm bài trắc nghiệm

này với một nhóm lớn đã đƣợc chọn làm chuẩn mực.

1.2.2.5. Điểm tiêu chuẩn (Standard scores)

a) Mô tả: Điểm tiêu chuẩn là điểm biến đổi từ điểm thô dựa trên cơ sở độ lệch tiêu

chuẩn của phân bố điểm số. Chúng có thể đƣợc xem nhƣ là những điểm số đã đƣợc

gán cho một trung bình và một độ lệch tiêu chuân nào đó. Nó thƣờng đƣợc sử dụng

trong trắc nghiệm vì một số đặc tính sau:

- Mỗi loại điểm tiêu chuẩn có trung bình và độ lệch tiêu chuẩn chung cho mọi

bài trắc nghiệm và mọi nhóm ngƣời.

- Điểm tiêu chuẩn cho phép ta thực hiện so sánh các trắc nghiệm hoặc giữa các

nhóm ngƣời.

- Có thể xử lý bằng mọi phƣơng pháp toán học.

b) Các loại điểm tiêu chuẩn thông dụng: điểm Z, điểm V. Ở nƣớc ngoài còn có

điểm Stanine (9 bậc), điểm C-Guilford, điểm T, Điểm AGCT, điểm CEEB. Về trắc

nghiệm trí tuệ ngƣời ta dùng thƣơng số trí tuệ IQ (với các trắc nghiệm Vechsler,

Stanford - Binet, v.v…).

c) Ƣu, nhƣợc điểm của các loại điểm tiêu chuẩn: Điểm tiêu chuẩn có ƣu điểm hơn

điểm % đúng, thứ hạng bách phân vị nó có thể dùng tính toán hoặc đối chiếu các kết

quả. Nhƣ: cộng các điểm tiêu chuẩn của nhiều bài trắc nghiệm môn học khác nhau để

tính trung bình (ta vẫn hay làm trong điểm bài luận đề lâu nay); so sánh hai hay nhiều

điểm trung bình của 1 bài trắc nghiệm ra trên nhiều nhóm, đối chiếu điểm trên các bài

trắc nghiệm khác nhau; tính hệ số tƣơng quan (với một bài trắc nghiệm đã chuẩn hóa)

25

để xác định tính giám của bài trắc nghiệm mới soạn. Nhƣợc điểm của điểm tiêu chuẩn

là:

+ Nếu các dữ kiện có độ xiên quá lớn thì việc sử dụng điểm tiêu chuẩn là không

thích hợp vì là một loại điểm tƣơng đối, nếu bài quá dễ hay quá khó đối với nhóm học

sinh thì điểm trung bình bị lệch nhiều so với vùng trung tâm. Các điểm số không còn

phản ánh đúng thực chất khả năng lĩnh hội bài học của học sinh.

+ Vì điểm tiêu chuẩn phụ thuộc vào độ lệch tiêu chuẩn nên khó giải thích ý

nghĩa của các điểm số trắc nghiệm. Học sinh đạt 7 môn Anh văn có thể là giỏi trong

lớp, trong khi điểm 7 môn Toán chỉ là khá trong lớp đó.

1.2.2.6. Công thức đổi điểm thô sang một số điểm tiêu chuẩn

a) . Điểm Z (Z score): Điểm Z liên hệ đến phân bố bình thƣờng tiêu chuẩn với trung

bình = 0 và độ lệch tiêu chuẩn = 1.

Công thức chuyển đổi: Z = (X – điểm trung bình X) / s

Trong đó X là một điểm thô; X = điểm thô trung bình của nhóm làm trắc

nghiệm; s = độ lệch tiêu chuẩn của nhóm.

Điểm Z cho biết vị trí của một học sinh có điểm thô X so với trung bình của

nhóm học sinh cùng làm bài trắc nghiệm..

Bảng Z và công dụng: Đây là bảng cho các trị số là diện tích tính theo tỉ lệ %.

Diện tích này chính là tích phân (tích phân Laplace) giới hạn bởi đƣờng cong bình

thƣờng tiêu chuẩn (đƣờng Gauss, N(0,1)) với trục hoành tính từ giá trị Z = 0 (tức ngay

tại trị trung bình) đến giá trị Z > 0 xác định nào đó (xin xem bảng Z đính kèm cuối

chƣơng này). Do tính đối xứng của đƣờng cong qua trục tung (Z=0) nên tổng diện tích

trong bảng (từ trung bình trở lên) sẽ là 50%.

Công dụng: trị số đọc trong bảng cho ta tính ƣớc lƣợng tỉ lệ % học sinh ở phía

dƣới hay phía trên một học sinh đạt điểm số Z nào đó.

b) Điểm tiêu chuẩn V: Căn bản giống nhƣ điểm Z, nhƣng đƣợc quy về phân bố bình

thƣờng có trung bình = 10 và độ lệch tiêu chuẩn là 4. Loại điểm này đƣợc áp dụng tại

Việt Nam trƣớc 1975, với hệ thống điểm cho từ 0 -> 20. Để có điểm V, trƣớc hết đổi

điểm thô X ra Z, sau đó áp dụng công thức và làm tròn số để nhận đƣợc giá trị nguyên:

26

Điểm tiêu chuẩn V = 4Z + 10 Ngày nay, để phù hợp với hệ thống điểm từ 0 -> 10, có

thể dùng điểm tiêu chuẩn V mới với trung bình = 5 và độ lệch tiêu chuẩn là 2. Điểm V

(mới) = 2Z + 5

Tổng quát, nếu ta đổi một điểm thô X sang một loại điểm tiêu chuẩn Xtc có

trung bình = Mtc và độ lệch tiệu chuẩn = stc nhờ trung gian điểm Z thì áp dụng công

thức: Điểm tiêu chuẩn Xtc = Stc Z + Mtc

Chúng ta đã làm quen với khái niệm điểm thô của bài trắc nghiệm cùng nhiều

loại điểm số khác thƣờng đƣợc sử dụng trong trắc nghiệm. Điểm thô là tổng điểm các

câu học sinh làm đúng. Điểm phần trăm đúng, thứ bậc bách phân, điểm tiêu chuẩn là

điểm đƣợc biến đổi từ điểm thô theo các cách khác nhau. Trong quá trình tiếp cận các

công thức tính ta cũng tìm hiểu cả ý nghĩa và giải thích công dụng của từng loại điểm.

Trong các loại điểm đã đề cập, ta chú ý nhiều đến điểm tiêu chuẩn vì các ƣu điểm của

nó. Tuy nhiên, ta cần nhớ rằng không có một loại điểm nào là hoàn hảo mà tùy thuộc

vào mục đích sử dụng, vào tính chất của bài thi mà ta chọn một loại điểm phù hợp.

27

1.3. Lý thuyết ứng đáp câu hỏi

Lý thuyết đánh giá cổ điển (CTT) là cách tiếp cận chi phối cho đến năm 1953

khi Frederic Lord đã công bố luận văn tiến sĩ của mình về Lý thuyết năng lực tiềm ẩn

(Latent Trait Theory). Vào những năm 1970, lý thuyết ứng đáp câu hỏi (IRT – Item

Response Theory) bƣớc đầu có những nghiên cứu một cách đột phá và đầy đủ. Đầu

những năm 2000 khi các công cụ tính toán (phần mềm chuyên dụng) hỗ trợ tốt hơn

ứng dụng IRT vào các hệ thống đánh giá, khảo thí mới thực sự diễn ra. Tuy nhiên các

trung tâm nghiên cứu về IRT chủ yếu vẫn Mỹ hoặc liên quan đến các trƣờng đại học ở

Mỹ. IRT đƣợc xây dựng dựa trên một số tiên đề và dựa trên một hàm phân bố xác suất

của năng lực thí sinh theo các tham số (độ khó,…) của câu hỏi.

1.3.1. Tổng quan về lý thuyết ứng đáp câu hỏi

Để đo lƣờng năng lực của thí sinh (TS), chúng ta cần bộ câu hỏi (CH) đƣợc

thiết kế đúng mục tiêu cần đo. Khi đó năng lực của thí sinh là một đại lƣợng ẩn, nó chỉ

đƣợc biểu hiện thông qua quan sát phản ứng của TS với các câu hỏi. Chúng ta cần

công nhận với nhau rằng:

- Năng lực tiềm ẩn (latent trait) cần đo chỉ có một chiều (unidimensionality),

hoặc ta chỉ quan tâm đo một chiều của năng lực đó mà các chiều năng lực khác không

ảnh hƣởng .

- Các câu hỏi trong một bài thi là độc lập với nhau địa tức là việc trả lời một

CH không ảnh hƣởng đến các CH khác trong cùng một đề thi.

Khi đó chúng ta sẽ có một tƣơng quan giữa năng lực của TS biểu hiện qua sự

ứng đáp của TS vỡi mỗi câu hỏi và bộ công cụ đo (bộ CH) độc lập địa phƣơng với

nhau (các câu hỏi không ảnh hƣởng lẫn nhau). Mô hình về mối tƣơng quan này đã

đƣợc Allen Birnbaum và Lord đề xuất mô hình vòm chuẩn (dạng phân phối chuẩn) để

biểu diễn mỗi quan hệ năng lực ứng đáp của TS với CH. Tuy nhiên mô hình toán học

của dạng vòm chuẩn là quá phức tạp, và Birnbaum còn đề xuất một mô hình có luôn

tham số độ khó, độ phân biệt nên việc tính toán ban đầu gặp rất nhiều khó khăn. Năm

1960 (thực ra năm 1953) George Rasch đề xuất một mô hình mới là mô hình logistic

thây thế cho mô hình vòm chuẩn, đồng thời Rasch chỉ đƣa vào mô hình của mình một

tham số là độ khó. Do vậy Rasch đã xây dựng đƣợc cơ sở lý thuyết của nó, phá dỡ các

28

rào cản mà mô hình của Lord và Birnbaum gặp phải. Thực tế sau này (những năm 70)

các nhà nghiên cứu thế hệ hai đã dễ dàng chứng mình đƣợc hai mô hình: Vòm chuẩn

và logistic là tƣơng đƣơng nhau đồng thời trên mô hình logistic ta có thể đƣa vào các

tham số khác ngoài độ khó nhƣ độ phân biệt, độ đoán mò,…. Chúng ta sẽ tiếp cận mô

hình logistic lần lƣợt một, hai, ba tham số ở đoạn sau.

Ứng với mỗi câu hỏi trong đề thi, dùng đề đo các năng lực khác nhau, mỗi năng

lực có các đáp ứng khác nhau lên câu hỏi. Theo [3, tr. 87] ngƣời ta giả định là có

một hàm đặc trưng câu hỏi (Hàm ĐTCH - Item Characteristic Function) phản ánh mối

quan hệ giữa các biến không quan sát đƣợc (năng lực của TS) và các biến quan sát

đƣợc (việc trả lời CH). Đồ thị biểu diễn hàm đó đƣợc gọi là đường cong đặc trưng câu

hỏi (Đƣờng cong ĐTCH - Item Characteristic Curve).

Đối với các cặp TS – CH, cần xây dựng một thang đo chung để biểu diễn mối

tƣơng tác giữa năng lực tiềm ẩn và đáp ứng với độ khó câu hỏi. Theo [3, tr. 87 – 88],

ta có thể biểu diễn năng lực tiềm ẩn của các TS bằng một biến liên tục θ dọc theo một

trục, từ –∞ đến +∞. Khi xét phân bố năng lực của một tập hợp TS nào đó, ta gán giá trị

trung bình của phân bố năng lực của tập hợp TS đó bằng không làm gốc của thang đo

năng lực, và độ lệch tiêu chuẩn của phân bố năng lực bằng 1. Chọn một thuộc tính của

CH để đối sánh với năng lực: tham số biểu diễn thuộc tính quan trọng nhất đó là độ

khó b của CH (cần lƣu ý là đại lƣợng độ khó ở đây sẽ đƣợc xác định khác với trong

CTT). Cũng theo cách tƣơng tự có thể biểu diễn độ khó của các CH bằng một biến liên

tục dọc theo một trục, từ –∞ đến +∞. Khi xét phân bố độ khó của một tập hợp CH nào

đó, ta chọn giá trị trung bình của phân bố độ khó đó bằng không (0), làm gốc của

thang đo độ khó, và độ lệch tiêu chuẩn của phân bố độ khó CH bằng 1.

1.3.2. Hàm đặc trưng câu hỏi

Có nhiều cách tiếp cận để xây dựng mô hình hàm đặc trƣng câu hỏi, nhƣng

cách xây dựng của Baker [10] là dễ hiểu và dễ tiếp cận. Tài liệu [3] của giáo sƣ Lâm

Quang Thiệp viết về vấn đề này cũng hết sức logic, súc tích và dễ hiểu. Theo [3, tr. 89

– 91], Giả thiết cơ bản sau đây của George Rasch, nhà toán học Đan Mạch, đƣợc đƣa

ra làm cơ sở để xây dựng mô hình hàm đáp ứng CH một tham số:

29

Một người có năng lực cao hơn một người khác thì xác suất để người đó trả lời

đúng một câu hỏi bất kì phải lớn hơn xác suất của người sau; cũng tương tự như vậy,

một câu hỏi khó hơn một câu hỏi khác có nghĩa là xác suất để một người bất kì trả lời

đúng câu hỏi đó phải bé hơn xác suất để trả lời đúng câu hỏi sau [16, tr. 117]

Với giả thiết nêu trên, theo [3, tr. 89 - 91] có thể thấy xác suất để một TS trả lời

đúng một CH nào đó phụ thuộc vào tƣơng quan giữa năng lực của TS và độ khó của

CH. Chọn Θ để biểu diễn năng lực của TS, và β để biểu diễn độ khó của CH. Gọi P là

xác suất trả lời đúng CH, xác suất đó sẽ phụ thuộc vào tƣơng quan giữa Θ và β theo

một cách nào đó, do vậy ta có thể biểu diễn: (1)

Trong đó f là một hàm nào đó của xác suất trả lời đúng. Lấy logarit tự nhiên

của (1)ta đƣợc : (2)

Khi xét mô hình trắc nghiệm nhị phân, Rasch chọn hàm f chính là mức được

thua (odds) O, hoặc khả năng thực hiện đúng (likelyhood ratio), tức là

biểu diễn tỉ số của khả năng trả lời đúng và khả năng trả lời sai nên

(3) Từ đó hay (4)

Hình 1.1 Đường cong ĐTCH một tham số

30

Biểu thức (4) chính là hàm đặc trƣng của mô hình ứng đáp CH 1 tham số, hay

còn gọi là mô hình Rasch, có thể biểu diễn bằng đồ thị dƣới đây (khi cho b = 0)

Tuy nhiên, nhƣ đã biết, trong CTT, ngƣời ta còn sử dụng một tham số quan

trọng thứ hai đặc trƣng cho CH là độ phân biệt, từ đó nhiều nhà nghiên cứu mong

muốn đƣa đặc trƣng đó vào mô hình đƣờng cong ĐTCH. Các mô hình 1, 2, 3 tham số

lần lƣợt đƣợc giới thiệu sau đây đƣợc viết khá kĩ và dễ hiểu trong [3, tr. 92 – 99]. Ta

có thể đƣa thêm tham số a liên quan đến đặc trƣng phân biệt của CH vào hệ số ở số

mũ của hàm e, kết quả sẽ có biểu thức: (5)

Hình 1.2 Các đường cong ĐTCH hai tham số với các giá trị a khác nhau (b= 0)

Hàm đáp ứng năng lực của CH (5) chính là hàm ĐTCH 2 tham số. Hệ số a biểu

diễn độ dốc của đƣờng cong ĐTCH tại điểm có hoành độ θ= b và tung độ P(θ) = 0,5.

Hàm ĐTCH 2 tham số trình bày trên đây và hàm ĐTCH 1 tham số theo mô hình Rasch

có cùng dạng thức, chỉ khác nhau ở giá trị tham số a (đối với mô hình 1 tham số a=1).

Hình 1.2 biểu diễn các đƣờng cong ĐTCH theo mô hình 2 tham số với b=0, và a lần

lƣợt bằng 0,5; 1,0; 1,5; 2,0; 3,0 nên độ dốc của các đƣờng cong ở đoạn giữa tăng dần.

Có thể thấy rằng tung độ tiệm cận trái của các đƣờng cong ĐTCH 1 và 2 tham số đều

có giá trị bằng 0, điều đó có nghĩa là nếu TS có năng lực rất thấp, tức là Θ → 0 và θ =

ln Θ → -∞, thì xác suất P(θ) trả lời đúng CH cũng bằng 0. Tuy nhiên, trong thực tế

triển khai trắc nghiệm, chúng ta đều biết có khi năng lực của TS rất thấp nhƣng do

đoán mò hoặc trả lời hú hoạ một CH nên TS vẫn có một khả năng nào đó trả lời đúng

31

CH. Trong trƣờng hợp đã nêu thì tung độ tiệm cận trái của đƣờng cong không phải

bằng 0 mà bằng một giá trị xác định c nào đó, với 0 < c < 1. Từ thực tế nêu trên, ngƣời

ta có thể đƣa thêm tham số c phản ánh hiện tƣợng đoán mò vào hàm ứng đáp CH để

tung độ tiệm cận trái của đƣờng cong khác 0. Kết quả sẽ thu đƣợc

(6)

Hình 1.3. Các đường cong ĐTCH 3 tham số với a = 2, c = 0,1 và 0,2.

Hàm đáp ứng năng lực của CH (6) chính là hàm ĐTCH 3 tham số. Rõ ràng khi

θ → -∞, hàm P(θ)→ c. Trong trƣờng hợp hàm ĐTCH 3 tham số khi θ = b sẽ có P(θ) =

(1+c)/2. Chúng ta đã chọn mô hình một tham số, mô hình Rasch, làm mô hình trình

bày đầu tiên trong các mô hình đƣờng cong ĐTCH vì mô hình này đơn giản nhất và

phản ánh tƣờng minh nhất mối quan hệ giữa TS và CH, sau đó chúng ta đã làm quen,

mở rộng với mô hình hai, ba tham số. Đã có rất nhiều các nghiên cứu so sánh chất

lƣợng đánh giá câu hỏi thi ở các mô hình 1, 2, 3 tham số. Nhƣng mô hình một tham số

vẫn đƣợc dùng phổ biến bởi tính đơn giản của nó. Tuy nhiên, nhƣ đã nói trên đây,

trong tiến trình lịch sử hình thành IRT, không phải mô hình Rasch xuất hiện trƣớc các

mô hình khác. Nhà toán học và tâm lý học ngƣời Đan Mạch, George Rasch, đã có ý

tƣởng xây dựng "một mô hình cấu trúc cho các CH trong một đề trắc nghiệm" từ thập

niên 1950, đề xuất mô hình xác suất logistic đó từ 1953, nhƣng ở Mỹ, ngƣời ta biết

đến công trình của ông từ khi ông công bố chính thức trong một cuốn sách xuất bản

năm 1960 [12]. Động cơ của Rasch muốn thể hiện qua mô hình của mình là hạn chế

việc dựa vào tổng thể TS khi phân tích các đề trắc nghiệm (ĐTN). Theo ông, phân tích 32

trắc nghiệm chỉ đáng giá khi dựa vào từng cá nhân TS, với các thuộc tính của TS và

CH đƣợc tách riêng. Quan điểm của Rasch đã đánh dấu sự chuyển tiếp từ CTT, dựa

trên tổng thể với việc nhấn mạnh đến biện pháp tiêu chuẩn hoá và ngẫu nhiên hoá,

sang IRT với mô hình xác suất tƣơng tác giữa một TS và một CH. Sự tồn tại của các

số liệu thống kê đầy đủ của các tham số của CH trong mô hình Rasch có thể đƣợc sử

dụng vào việc điều chỉnh ƣớc lƣợng các tham số năng lực theo một cách thức đặc biệt.

Để chi tiết hơn ta có thể tham khảo các tài liệu [Wikipedia], [3].

Theo [3], một trong những ƣu điểm lớn của mô hình Rasch là tách biệt đƣợc

năng lực của TS và đặc trƣng của CH (độ khó) trong phép đo lƣờng. Thật vậy, nếu có

hai TS có năng lực θ1 và θ2 cùng ứng đáp một CH thì từ biểu thức (3) có thể thu đƣợc

ln (O1/O2) = (θ1 – θ2), tức là có thể xác định các năng lực của TS không phụ thuộc độ

khó CH. Vì tính đối xứng của biểu thức, cũng dễ thấy rằng, ngƣợc lại, có thể xác định

các độ khó của CH không phụ thuộc năng lực TS. Chính vì tính chất cơ bản này nên

có thể đặt năng lực của các TS và độ khó của các CH trên cùng một thang đo để so

sánh chúng với nhau. Tuy nhiên, một số nhà nghiên cứu khác cho rằng về lý thuyết thì

dạng toán học của mô hình Rasch có nhiều lợi thế, nhƣng khi nói đến mô hình toán

học, tức là nói đến một sự giả định, tiêu chuẩn để đánh giá hiệu quả của mô hình là sự

phù hợp của chúng với số liệu thực nghiệm chứ không chỉ thuần túy ở dạng toán học.

Ngƣời ta thƣờng gọi quan điểm của Wright là quan điểm "dựa trên mô hình" (model–

based), còn quan điểm ngƣợc lại là quan điểm "dựa trên dữ liệu" (data–based).[3, tr.

98 – 99].

1.3.3. Điểm thực và đường cong đặc trưng đề trắc nghiệm

Đây là một khái niệm hoàn toàn mới, bởi trƣớc đây chúng ta thƣờng quen thuộc

với các điểm thô, điểm Z, điểm bách phân. Chúng chỉ phản ánh các con số khô khan

mang tính định danh và thứ tự mà chƣa phản ảnh rõ “tính chất” của đối tƣợng cần đo.

Trong các phép đo lƣờng, để xác định chính xác giá trị đƣợc đo và sai số của một phép

đo ngƣời ta thƣờng thực hiện phép đo đó nhiều lần. Trong trắc nghiệm, thực tế không

làm đƣợc nhƣ vậy, nhƣng có thể quy ƣớc định nghĩa về điểm trung bình của một TS

qua hàng loạt phép đo bằng một ĐTN. Điểm quan sát X của một ĐTN qua hàng loạt

phép đo đƣợc xem là một biến ngẫu nhiên với một phân bố tần suất nào đó thƣờng là

33

không biết. Giá trị trung bình của phân bố đó đƣợc gọi là điểm thực τ của TS, có quan

hệ nhƣ sau với các điểm quan sát X và sai số ε: ε = X – τ. (7)

Theo [3, tr. 117 – 128], trong CTT, điểm thực đƣợc định nghĩa trên đây là một

sự trừu tƣợng toán học, không có quy trình nào để xác định. Cũng do đó, sai số của

phép đo ε là một đại lƣợng có tính chất trung bình đối với toàn bộ dải năng lực của TS.

Tuy nhiên trong IRT, có thể chứng minh đƣợc rằng điểm thực đƣợc xác định bởi một

ĐTN gồm n CH có thể tính theo biểu thức sau đây: (8)

Tức là: điểm thực của một TS có năng lực θ là tổng của các xác suất trả lời

đúng của mọi CH của ĐTN tại giá trị θ. Nhƣ vậy, đối với mọi giá trị θ, nếu chúng ta

tiến hành cộng tất cả mọi đƣờng cong ĐTCH trong ĐTN, sẽ thu đƣợc đƣờng cong đặc

trƣng của ĐTN, hoặc cũng gọi là đƣờng cong điểm thực. Đƣờng cong đặc trƣng của

ĐTN là quan hệ hàm số giữa điểm thực và thang năng lực: cho trƣớc một mức năng

lực bất kì có thể tìm điểm thực tƣơng ứng qua đƣờng cong đặc trƣng ĐTN.

Hình 1.4. Đường cong đặc trưng của ĐTN gồm 5 CH và 5 đường cong ĐTCH tương ứng.

Minh họa trên Hình 1.4 cho thấy một đƣờng cong đặc trƣng ĐTN thu đƣợc

bằng cách cộng 5 đƣờng cong ĐTCH. Vì là chồng chất của các đƣờng cong ĐTCH

nên đƣờng cong đặc trƣng ĐTN cũng có dạng một hàm đồng biến. Tiệm cận phải của

đƣờng cong khi θ → +∞ bằng điểm thực tối đa, n, tức là bằng tổng số CH trong ĐTN.

Tung độ tiệm cận trái của đƣờng cong khi θ tiến đến θ → -∞ bằng 0 đối với các mô

hình 1 và 2 tham số, và bằng giá trị tổng cộng các tham số đoán mò Σcj của toàn

bộ n CH trong ĐTN đối với mô hình 3 tham số. Độ nghiêng của phần giữa đƣờng cong 34

đặc trƣng ĐTN liên quan đến độ phân biệt của ĐTN. Mức năng lực ứng với trung

điểm của thang điểm thực (n/2) xác định vị trí của ĐTN trên thang năng lực. Hoành độ

của điểm đó xác định độ khó của ĐTN. Hai yếu tố độ dốc và mức năng lực ở trung

điểm thang điểm thực mô tả khá rõ đặc tính của một ĐTN.

Một điều khá lý thú là, khi biết năng lực θ của một TS, nhờ đƣờng cong điểm

thực của một ĐTN cụ thể có thể xác định đƣợc điểm thực của TS thu đƣợc từ ĐTN đó

mà TS không cần phải làm ĐTN. Từ đó có thể tiên đoán điểm thực của TS hoặc tình

trạng TS đạt hay không đạt điểm cần thiết đối với một ĐTN mới.

1.3.4. Hàm thông tin của câu hỏi và của đề trắc nghiệm

Để đánh giá chất lƣợng các đề thi và so sánh định chuẩn các đề thi, ngƣời ta cần

xây dựng các tham số phản ánh tính chất nội tại của đề thi. Theo [3, tr. 129 – 136] mỗi

một CH trắc nghiệm cung cấp một lƣợng thông tin nào đó về năng lực cần đo của các

TS. Birnbaum A. đã đề xuất biểu thức hàm hàm thông tin của CH (item information

function) đƣợc biểu diễn nhƣ sau: (9)

Trong đó Ii(θ) là thông tin cung cấp bởi CH thứ i ở mức năng lực θ, Qi(θ)=1-

Pi(θ), P'i(θ)là đạo hàm của Pi(θ) theo θ. Từ biểu thức (9) có thể suy ra các biểu thức

hàm thông tin tƣơng ứng với các mô hình ứng đáp CH khác nhau. Đối với mô hình

tổng quát 3 tham số, ta có: (10)

Vì tính độc lập địa phƣơng của các CH trắc nghiệm, 'hàm thông tin của ĐTN

(Test information Function) là tổng các hàm thông tin của các CH có trong ĐTN:

(11)

35 Hình 1.5. Đồ thị các hàm thông tin của các CH trắc nghiệm

và của ĐTN do các CH đó hợp thành

Ở Hình 1.5 đƣờng cong nét đậm biểu diễn hàm thông tin của ĐTN, còn các

đƣờng cong nét nhạt là các hàm thông tin của các CH trắc nghiệm. Mức thông tin

chung của ĐTN cao hơn nhiều so với mức thông tin của từng CH riêng rẽ, tức là một

ĐTN sẽ đo năng lực chính xác hơn nhiều so với chỉ một CH trắc nghiệm. Từ định

nghĩa hàm thông tin theo công thức (11) có thể thấy rõ: ĐTN càng có nhiều CH thì giá

trị của hàm thông tin càng cao, tức là một ĐTN dài thƣờng đo năng lực chính xác hơn

một ĐTN ngắn. Tùy theo tính chất của các CH tạo nên ĐTN mà hàm thông tin sẽ có

giá trị lớn (tức là đo chính xác) ở các khoảng năng lực xác định nào đó và giá trị bé

(tức là đo kém chính xác) ở các khoảng năng lực khác. Do những đặc điểm nêu trên,

hàm thông tin là một công cụ cực kì quan trọng của IRT, nó giúp thiết kế các ĐTN cho

các phép đo theo các mục tiêu xác định. Hàm thông tin lý tƣởng của một ĐTN là một

đƣờng nằm ngang, tức là phép đo có độ chính xác nhƣ nhau ở mọi khoảng năng lực.

Tuy nhiên, một ĐTN nhƣ vậy có thể không phải là tốt nhất đối với các mục tiêu cụ thể.

Chẳng hạn, nếu muốn thiết kế một ĐTN để cấp học bổng, cần một ĐTN đo rất chính

xác trong một khoảng hẹp ở mức năng lực là ranh giới giữa những TS đƣợc và không

đƣợc học bổng, tức là hàm thông tin có đỉnh cực đại ở điểm cắt (cut–off score), vì rằng

một sai số lớn trong phép đo ở khoảng năng lực này có thể chuyển một TS từ loại

đƣợc sang loại không đƣợc học bổng hoặc ngƣợc lại.

36

Sai số tiêu chuẩn của ĐTN: Sai số tiêu chuẩn của việc ƣớc lƣợng năng lực ở vị

trí θ bằng: (12)

Biểu thức (12) cho thấy hai đƣờng cong hàm thông tin và sai số tiêu chuẩn của

một ĐTN có hình dạng gần nhƣ đối xứng với nhau qua một đƣờng nằm ngang. Sự phụ

thuộc của sai số tiêu chuẩn Ϭ vào năng lực θ có một ý nghĩa quan trọng, chỉ rõ một

trong những khác biệt giữa CTT và IRT. Biểu thức (7) cho thấy trong CTT sai số ε của

phép đo là một đại lƣợng không đổi chung cho ĐTN đối với mọi TS có năng lực khác

nhau. Trong khi đó, đối với IRT, sai số của phép đo bằng ĐTN thay đổi theo các mức

năng lực. Đây cũng là một biểu hiện của việc "cá thể hoá" phép đo lƣờng của IRT mà

chúng ta đã đề cập khi bàn về mô hình Rasch trên đây.

Sai số tiêu chuẩn Ϭ(θ) của việc ƣớc lƣợng năng lực θ là độ lệch tiêu chuẩn của

phân bố gần chuẩn khi ƣớc lƣợng giá trị năng lực theo biến cố hợp lý cực đại ở một giá

trị năng lực θ nào đó. Phân bố sẽ tiến đến dạng chuẩn khi ĐTN đủ dài. Tuy nhiên,

nhiều nghiên cứu cho thấy rằng thậm chí các ĐTN ngắn cỡ 10 – 20 CH, sự phân bố

gần chuẩn cũng thoả mãn đối với một số mục đích.

Biên độ của hàm sai số tiêu chuẩn nói chung phụ thuộc vào: (1) số CH trong

ĐTN (số CH càng lớn sai số tiêu chuẩn càng bé); (2) chất lƣợng các CH của ĐTN (nói

chung các CH càng có độ phân biệt cao và khả năng đoán mò thấp sẽ tạo sai số tiêu

chuẩn bé); (3) độ khó CH gần với giá trị năng lực đƣợc đo (tức là ĐTN không quá khó

và không quá dễ). Việc tăng số CH trong ĐTN hoặc chọn các CH với giá trị hàm

thông tin lớn sẽ làm tăng giá trị thông tin của ĐTN và giảm sai số tiêu chuẩn; tuy

nhiên khi hàm thông tin vƣợt quá một giá trị nào đó thì sai số tiêu chuẩn sẽ trở nên ổn

định và sự tăng tiếp tục của hàm thông tin sẽ có tác động không lớn lên giá trị của sai

số tiêu chuẩn.

Áp dụng hàm thông tin vào việc khảo sát và thiết kế ĐTN: Hàm thông tin của

ĐTN có một số ứng dụng quan trọng. Trƣớc hết, qua hàm thông tin có thể biết mức độ

chính xác của phép đo bằng ĐTN: Giá trị hàm thông tin càng lớn ở khoảng năng lực

nào thì độ chính xác của phép đo ở khoảng năng lực đó càng cao, và ngƣợc lại. Một

ứng dụng khác rất quan trọng của hàm thông tin là giúp thiết kế các ĐTN có mức

37

tƣơng đƣơng cao. Theo IRT, các ĐTN tƣơng đƣơng phải thoả mãn hai điều kiện: (1)

điều kiện về nội dung và mục tiêu, thể hiện ở sự trùng hợp của các ma trận đặc trƣng

ĐTN (số lƣợng câu hỏi trong các ô ứng với nội dung và mục tiêu học tập cụ thể phải

trùng nhau); (2) điều kiện về thống kê: các đƣờng cong hàm thông tin của các ĐTN

phải trùng khớp nhau trong một phạm vi sai số chấp nhận nào đó.

1.3.5. Ước lượng năng lực thí sinh và tham số câu hỏi

Nhƣ đã biết, các mô hình IRT xét mối tƣơng tác của một TS có năng lực θ với

một CH có các tham số a, b, c. Tuy nhiên, trong hoạt động đánh giá thực tế, cái mà

chúng ta có thể thu đƣợc trực tiếp từ số liệu kiểm tra là việc trả lời các CH của các TS

qua bài trắc nghiệm. Từ các số liệu thu đƣợc trực tiếp đó làm sao xác định các tham

số a, b, c' của các CH và năng lực θ của các TS? Đó là bài toán cơ bản và quan trọng

nhất của IRT, vì năng lực của TS là cái cuối cùng mà ta muốn biết, còn các tham số

của CH là cần thiết để chúng ta có thể sử dụng các CH nhằm thiết kế các công cụ thích

hợp để đo lƣờng chính xác năng lực của TS. Bài toán quan trọng đó đƣợc giải quyết

bằng các thuật toán ƣớc lƣợng năng lực TS và tham số CH, việc tìm ra các thuật toán

tốt nhất để giải bài toán này là một trong các mục tiêu quan trọng của IRT, và có thể

nói quyết định thành công của việc áp dụng IRT vào thực tế hoạt động đánh giá. Tuy

nhiên, muốn trình bày đầy đủ thuật toán đã nêu cần nhiều kiến thức về toán học và

thống kê học. Bạn đọc muốn đi sâu vào những vấn đề đó có thể tìm hiểu sơ bộ ở [10] ,

và đầy đủ hơn trong [3].

1.3.6. So bằng và kết nối các đề trắc nghiệm

Theo IRT, về nguyên tắc, các tham số CH xác định đƣợc không phụ thuộc vào

mẫu TS, và năng lực TS đo đƣợc không phụ thuộc vào ĐTN cụ thể. Tuy nhiên đó là

các tính chất lý tƣởng, chỉ tuyệt đối đúng trong cả tổng thể khảo sát khi số liệu thực tế

hoàn toàn phù hợp với mô hình giả định, và các giả thiết khác về mô hình đƣợc tuân

thủ. Thao tác đƣa tham số của các CH cũng nhƣ năng lực TS về thang đo chung gọi

là so bằng (equating). So bằng là yêu cầu rất quan trọng trong thực tiễn đánh giá.

Chẳng hạn, có hai mẫu TS khác nhau đƣợc đánh giá bằng hai ĐTN khác nhau, năng

lực của mỗi mẫu TS đƣợc một ĐTN đo lƣờng và thu đƣợc một bộ điểm. Muốn hai bộ

điểm của hai mẫu TS thu đƣợc từ hai ĐTN có thể so sánh đƣợc với nhau, ngƣời ta phải

38

chuyển chúng về một thang đo chung, tức là so bằng. Cũng vậy, nếu hai ĐTN đƣợc

triển khai trên hai nhóm TS khác nhau để định cỡ (calibration) các CH trắc nghiệm,

tức xác định các tham số của chúng, từ mỗi ĐTN sẽ thu đƣợc một bộ tham số của các

CH. Muốn tham số của các CH của ĐTN thu đƣợc từ hai mẫu TS có thể so sánh đƣợc

với nhau ngƣời ta cũng phải dùng thủ thuật so bằng nhằm chuyển các tham số của CH

về một thang đo chung. Sau khi so bằng, mỗi giá trị tham số của CH từ hai ĐTN đƣợc

đặt trên cùng một thang đo nên có thể so sánh với nhau, chẳng hạn để lựa chọn CH có

tham số thích hợp nhằm thiết kế một ĐTN theo yêu cầu xác định. Có nhiều thủ tục so

bằng khác nhau. Bạn đọc muốn tìm hiểu có thể tham khảo trong [10], hoặc tỉ mỉ hơn

trong [13]

1.3.7. Về trắc nghiệm đa phân và trắc nghiệm đa chiều

Khi đặt vấn đề xây dựng mô hình toán phản ánh sự ứng đáp CH ở phần đầu, để

đơn giản cho mô hình, chúng ta đã giả thiết là việc ứng đáp kiểu nhị phân (0,1). Tuy

nhiên, trong thực tế đánh giá ngƣời ta còn sử dụng loại CH với kiểu ứng đáp đa

phân (polytomous) hoặc đánh giá một năng lực đa chiều (multidimentionality) hay

đánh giá đồng thời nhiều chiều của năng lực. Dƣới đây sẽ giới thiệu khái quát về trắc

nghiệm đa phân và đa chiều. Đây là các đặc điểm tƣơng đổi mới trong IRT bới sự

phức tạp của các mô hình đi kèm, các nghiên cứu chính chủ yếu trong các tài liệu [14],

[15]. Các kết quả chủ yếu đƣợc công bố từ đầu những năm 2000. Tuy nhiên đây là các

ƣu điểm nổi trội của IRT, khắc phục việc CTT chỉ phân tích đƣợc các câu hỏi nhị phân

mà không thể phân tích ĐTN với các câu hỏi nhị phân, đa phân và đa chiều. Theo [3,

tr. 218 – 260] ta sẽ xem xét cụ thể các mô hình này.

1.3.7.1. Mô hình trắc nghiệm đa phân

Ngoài các loại trắc nghiệm nhiều lựa chọn mà trả lời theo hai trạng thái nhị

phân (0,1), ngƣời ta còn sử dụng các loại bảng hỏi (questionaire) với kiểu trả lời theo

thang Likert: „‟rất không đồng ý, không đồng ý, đồng ý, rất đồng ý‟‟ trong các điều tra

giáo dục hoặc xã hội học nói chung, hoặc các câu hỏi tự luận bao gồm nhiều phần, mỗi

phần đƣợc định các mức điểm khác nhau, có thể gọi chung là các câu hỏi với ứng đáp

đa phân (polytomous). Một số nhà nghiên cứu cũng đã lƣu ý đến mô hình trắc nghiệm

đa phân từ cuối thập niên 1960 và tập trung mạnh mẽ từ đầu thập niên 1980. Nhà

39

nghiên cứu quan tâm đến mô hình đa phân sớm nhất có lẽ là Samejima ngƣời đã đƣa

vào mô hình ứng đáp đa cấp (graded response model) [14]. Sau đó có hàng loạt mô

hình đƣợc đề xuất, nhƣng tổng quát nhất có lẽ là mô hình định giá từng phần (Partial

Credit Model – PCM) của Master, G.N.

Để thiết lập PCM, Masters xét một CH có nhiều hạng (category) điểm để TS

đạt đƣợc, và giả định rằng xác suất để TS đạt hai hạng điểm kế tiếp nhau tuân theo quy

luật của mô hình Rasch nhị phân. Dựa vào giả định nêu trên, khi CH thứ i là đa phân

với các hạng điểm 0, 1, 2,..., mi thì Masters thu đƣợc xác suất để TS n đạt điểm x của

CH thứ i sẽ là: (13) trong đó, để tiện trong việc ký

hiệu, chúng ta quy định

Lƣu ý rằng trong biểu thức (13), δik đóng vai trò nhƣ b trong mô hình Rasch nhị

phân. Với quan niệm của Masters, chúng ta có thể mô tả diễn biến của xác suất trả lời

đúng CH (đạt hạng điểm 1) theo năng lực θ của mô hình Rasch nhị phân ứng bởi biểu

thức (4) bằng đƣờng cong P(X = 1) và xác suất trả lời sai CH (đạt hạng điểm 0) bằng

đƣờng cong P(X = 0) trên cùng một đồ thị ở Hình 1.6

Hình 1.6. Các đường cong ĐTCH trắc nghiệm nhị phân ứng với

xác suất trả lời sai P(X = 0) và xác suất trả lời đúng P(X = 1)

Tƣơng tự, trong trƣờng hợp CH có 3 hạng điểm 0, 1 và 2 các đƣờng biểu diễn

ứng với 3 hạng điểm có dạng nhƣ Hình 1.7

40

Hình 1.7. Các đường cong ĐTCH của một CH PCM có 3 hạng điểm (với δ1<δ2).

1.3.7.2. Mô hình trắc nghiệm đa chiều

Khi xây dựng các mô hình ứng đáp CH, để đơn giản hoá, chúng ta đã đặt điều

kiện về tính đơn chiều (unidimentionality) của CH, tức là CH chỉ đo một thứ năng lực

tiềm ẩn, hoặc ta chỉ đo một chiều (dimension) của năng lực tiềm ẩn đa chiều

(multidimentionality). Tuy nhiên, trong thực tế, để thực hiện một ứng đáp nào đó, TS

thƣờng phải có các chiều khác nhau của năng lực, chẳng hạn để giải một bài toán, TS

cần cả kĩ năng đọc hiểu đề toán và các kĩ năng toán học. Reskase đã dựa vào trắc

nghiệm nhị phân (0,1) đơn chiều mở rộng ra mô hình trắc nghiệm nhị phân đa chiều

[15]. Trong mỗi TS các năng lực tiềm ẩn là khác nhau. Ví dụ khi làm bài kiểm tra

toán, thì năng lực giải toán hình học, đại số của TS là khác nhau. Với trƣờng hợp TS

có hai chiều năng lực θ1 và θ2, có thể vẽ đƣợc mặt cong đặc trƣng CH nhƣ ở Hình 1.8

Hình 1.8. Mặt ĐTCH với 2 chiều năng lực θ1,θ2

41

Về cách biểu hiện tính đa chiều, nhiều nhà nghiên cứu đƣa vào khái niệm tính

đa chiều giữa các CH và trong từng CH. Một bài trắc nghiệm là đa chiều giữa các CH

nếu nó bao gồm nhiều bài trắc nghiệm con đơn chiều. Một bài trắc nghiệm là đa chiều

trong từng CH nếu mỗi CH đòi hỏi nhiều chiều năng lực tiềm ẩn để trả lời. Hai kiểu đa

chiều của bài trắc nghiệm đƣợc minh hoạ ở Hình 1.9.

Hình 1.9. Hai kiểu biểu hiện tính đa chiều của các câu hỏi trắc nghiệm.

Ở nửa bên trái Hình 1.9 mô tả bài trắc nghiệm 3 chiều gồm 9 CH theo kiểu đa

chiều giữa các CH, mỗi chiều đƣợc đánh giá riêng biệt bởi 3 CH. Nửa bên phải của

Hình 1.9 mô tả bài trắc nghiệm 3 chiều gồm 9 CH với cả hai kiểu đa chiều giữa các

CH và đa chiều trong từng CH, trong đó 4 CH 1, 5, 8, 9 chỉ đo một chiều năng lực, còn

các CH khác đo đồng thời 2 hoặc 3 chiều năng lực. [3]

1.3.8. Ví dụ về ước lượng tham số câu hỏi

Với các mô hình IRT 2 và 3 tham số, quá trình ƣớc lƣợng cũng đƣợc thực hiện

theo nguyên tắc tƣơng tự nhƣ đã mô tả trên đây, tuy số tham số tính toán nhiều hơn.

Một trong các thuật toán thƣờng đƣợc sử dụng cho quy trình ƣớc lƣợng nói trên là

thuật toán biến cố hợp lý cực đại và nhiều thuật toán khác đƣợc trình bày trong [13].

Vì việc thực hiện bài toán ƣớc lƣợng giá trị năng lực của TS và các tham số của CH

khá phức tạp nên đa số bạn đọc thông thƣờng không cần phải bận tâm nhiều đến các

thuật toán cụ thể, bởi vì ngày nay đã có nhiều phần mềm chuyên dụng đƣợc các

42

chuyên gia tâm trắc học xây dựng phục vụ các bài toán ƣớc lƣợng đó. Chẳng hạn sau

đây là một số phần mềm đƣợc sử dụng tƣơng đối phổ biến hiện nay: CONQUEST của

Úc và WINSTEPS của Mỹ cho mô hình Rasch (một tham số) nhị phân và đa phân,

BILOG–MG3 của Mỹ cho mô hình 1, 2, 3 tham số nhị phân, PARSCALS,

MULTILOG cho mô hình đa phân,... Ở Việt Nam phần mềm đầu tiên phục vụ cho bài

toán này là VITESTA, cho các mô hình 1, 2, 3 tham số nhị phân và đa phân, đƣợc

công ty EDTECH–VN xây dựng từ năm 2007 [2]. Ta xét một ví dụ cho quá trình ƣớc

lƣợng các tham số của câu hỏi.

Để phù hợp với quá trình tính toán bằng tay ta xét một hình một tham số.

Chúng ta xem xét một bài kiểm tra điển hình. Với N câu hỏi và với M ngƣời tham gia

kiểm tra. Điểm số của những ngƣời kiểm tra này sẽ đƣợc phân bổ trong một mức độ

khả năng về dải năng lực của thí sinh. Những ngƣời kiểm tra này đƣợc chia thành J số

nhóm cùng có cùng năng lực để tất cả ngƣời kiểm tra trong một nhóm nhất định có

cùng cấp độ năng lực θj và sẽ có mj ngƣời kiểm tra bên trong nhóm j, trong đó j = 1, 2,

3. . . J. Xét một câu hỏi nào đó thì trong cùng một nhóm có rj ngƣời kiểm tra trả lời

đúng câu hỏi đã cho. Nhƣ vậy, ở mức độ năng lực θj,tỷ lệ đáp ứng đúng là p(θj) = rj /

mj, là ƣớc tính của xác suất trả lời chính xác ở mức khả năng θj. Bây giờ có thể thu

đƣợc giá trị của rj và p (θj) đƣợc tính cho mỗi cấp độ khả năng j đƣợc thiết lập theo dải

năng lực J. Nếu tỷ lệ đáp ứng chính xác trong mỗi nhóm khả năng đƣợc vẽ, kết quả sẽ

là giống nhƣ thể hiện trong hình 1.10

Hình 1.10. Mô tả đáp ứng câu hỏi

43

Nhiệm vụ tiếp theo là tìm ra đƣờng cong đặc trƣng của câu hỏi (ICC) phù hợp

nhất với tỷ lệ phản ứng đúng hay kết quả làm bài đối với câu hỏi của thí sinh. Để làm

nhƣ vậy, một mô hình cần phải đƣợc lựa chọn cho các ICC. Mặc dù bất kỳ một trong

ba mô hình có thể đƣợc sử dụng, mô hình hai tham số đƣợc sử dụng ở đây với

. Các thủ tục đƣợc sử dụng để phù hợp đƣờng cong dựa trên ƣớc

tính khả năng ƣớc lƣợng tối đa. Theo cách tiếp cận này, giá trị ban đầu cho các thông

số của câu hỏi cần đƣợc khởi tạo trƣớc, chẳng hạn nhƣ b = 0.0, a = 1.0. Sau đó, sử

dụng các ƣớc lƣợng để tính giá trị của P(θj) đƣợc tính tại mỗi nhóm năng lực thông

qua phƣơng trình cho ICC mô hình. Lƣu ý giá trị quan sát đƣợc của năng lực p(θj) và

giá trị tính toán P (θj) đƣợc xác định trên tất cả các nhóm năng lƣc. Sau đó, điều chỉnh

các tham số câu hỏi (a, b) ƣớc tính đƣợc để kết quả giữa P (θj) và p(θj) gần sát nhau

hơn nữa. Khi đó ICC đƣợc xác định bởi các giá trị ƣớc tính toán của các tham số thông

kê và tỷ lệ quan sát đƣợc của đƣờng cong đặc trƣng câu hỏi. Quá trình điều chỉnh ƣớc

tính này là tiếp tục cho đến khi các điều chỉnh quá nhỏ mà ít sự sai số giữa P (θj) và

p(θj) không còn đáng kể. Tại thời điểm này, thủ tục ƣớc lƣợng đƣợc chấm dứt và các

giá trị hiện tại của b và a là ƣớc lƣợng tham số câu hỏi. Với các giá trị này, phƣơng

trình cho ICC đƣợc sử dụng để tính xác suất phản ứng chính xác P (θj) ở mỗi cấp độ

năng lực và ICC có thể đƣợc vẽ. Đƣờng cong kết quả là ICC phù hợp nhất với dữ liệu

phản hồi của mục đó. Hình 2.2 cho thấy một ICC phù hợp với tỷ lệ quan sát đƣợc của

phản ứng chính xác thể hiện trong hình 2.1. Các giá trị ƣớc tính của các thông số mục

là b = -37 và a = 1,25.

44

Hình 1.11 Hàm đặc trưng câu hỏi

Nhƣ vậy với câu hỏi i nào đó sẽ có hàm đặc trƣng câu hỏi .

Để xét sự trùng khớp giữa P (θj) và p(θj) tốt ngƣời ta thƣờng dùng chỉ số Chi- bình

phƣơng nhỏ hơn một số tiêu chuẩn chọn trƣớc nào. Với các

câu hỏi mà quá trình trên khó hội tụ giữa hai giá trị P (θj) và p(θj) (Chi- bình phƣơng

luôn lớn số tiêu chuẩn đƣợc chọn) thì câu hỏi đó nên bị loại vì yếu tố kĩ thuật. Đó là

mô hình đƣờng cong đƣợc chọn không phù hợp (một, hai, ba tham số, …) hoặc giá trị

đáp ứng câu hỏi này rất phân tán nên phải chỉnh sửa lại câu hỏi hoặc loại bỏ.

Để đơn giản ta xét ví dụ sau, chúng ta hãy nhìn vào một ví dụ minh hoạ số cho

ƣớc lƣợng tham số câu hỏi. Để đơn giản và dễ hiểu ta xét mô hình Single Parameter

của Rasch minh hoạ. Do đó, một tham số duy nhất là độ khó của câu hỏi đƣợc ƣớc

tính. Chúng ta hãy lấy một ví dụ về một bài kiểm tra loại khách quan gồm 20 bài cho

76 thí sinh. Bảng dƣới đây minh họa dữ liệu về số điểm bên phải và số ngƣời kiểm tra

nhận đƣợc mỗi điểm:

45

Bảng 1.4. Dữ liệu thử nghiệm của câu hỏi thi

Số ngƣời trong nhóm

Nhóm năng lực (đƣợc phân chia bằng điểm số )

Xác xuất trả lời đúng p(θj) = rj / mj

Số câu trả lời đúng của nhóm năng lực trên tổng số ngƣời của nhóm 4

18

4

1

17

4

1

16

5

2

0.4

15

12

5

0.41

14

7

1

0.14

13

10

6

0.6

12

8

2

0.25

11

1

0.09

10

5

1

0.2

9

6

0

8

2

1

0.5

7

1

6

1

0

Đối với tỷ lệ câu trả lời đúng và nhóm điểm số bên phải cho ở trên, đồ thị đƣợc

vẽ với một ICC gần đúng nhƣ hình dƣới đây

Hình 1.12. Ước lượng hàm đặc trưng của câu hỏi

46

Một biểu đồ đồ họa thô của tỷ lệ các câu trả lời đúng ở mọi năng lực, số điểm

đƣợc vẽ lên đối với số điểm đúng đƣợc thu đƣợc bằng phƣơng pháp thử và sai số trong

đƣờng cong phù hợp. Biểu diễn thô đƣợc đƣa ra trong đồ thị. Có thể thấy rằng điểm

của đƣờng cong của đáp ứng đƣợc nhìn thấy ở một số điểm số bên phải là 15 tƣơng

ứng với một thô ƣớc tính 15 số đúng số và tƣơng ứng +1.5 trên thang điểm về khả

năng nhƣ đã nêu trong đồ thị. Giả sử ƣớc tính đầu tiên của độ khó b, của câu hỏi này

1.5. Cho một một tham số b = 1.5, ICC hoặc IRF thu đƣợc bằng cách sử dụng phần

mềm BIRT nhƣ hình dƣới đây:

Hình 1.13 Tham số ước lượng của câu hỏi

Hình 1.14 Đồ thị hàm đặc trưng của câu hỏi

47

Đƣờng cong BIRT của Pi (θ) ở tất cả các giá trị từ -3 đến +3 có thể đƣợc so

sánh với đạt đƣợc tỷ lệ các câu trả lời đúng ở mức điểm số ngay ở mức tƣơng ứng giả

định mức độ khả năng nhƣ thể hiện trong bảng dƣới đây:

48

Bảng 1.5 Dữ liệu tính toán ước lượng hàm đặc trưng câu hỏi

Nhóm năng lực

Dải năng lực

Xác xuất trả lời đúng quan sát đƣợc pi (θj)

18 17 16 15 14 13 12 11 10 9 8 7 6

1.0 1.0 0.4 0.41 0.14 0.6 0.25 0.09 0.2 0 0.5 1 0

Xác xuất đáp ứng câu hỏi của nhóm năng lực Pi (θj) 0.894 0.805 0.67 0.5 0.33 0.195 0.106 0.055 0.028 0.014 0.007 0.003 0

+3 +2.5 +2 +1.5 +1 +0.5 +0 -0.5 -1 -1.5 -2 -2.5 -3

Ta có hàm một tham số

với b =1.5 thì

Chi bình phƣơng đƣợc tính từ công thức

Số ngƣời trong nhóm

Q(θj)=1- P(θj)

Xác xuất trả lời đúng quan sát đƣợc

Xác xuất đáp ứng câu hỏi của nhóm năng lực

Nhóm năng lực

4 4 5 12 7 10 8 11 5 6 2 1 1

18 17 16 15 14 13 12 11 10 9 8 7 6

pi (θj) 1.0 1.0 0.4 0.41 0.14 0.6 0.25 0.09 0.2 0 0.5 1 0

Pi (θj) 0,894 0,805 0,67 0,5 0,33 0,195 0,106 0,055 0,028 0,014 0,007 0,003 0

0,106 0,195 0,33 0,5 0,67 0,805 0,894 0,945 0,972 0,986 0,993 0,997 1

0,011236 0,038025 0,0729 0,0081 0,0361 0,164025 0,020736 0,001225 0,029584 0,000196 0,243049 0,994009 0

0,474273 0,968944 1,648575 0,3888 1,142922 10,44912 1,750538 0,259259 5,435038 0,085193 69,9321 332,3333 0 424,8681

Bảng 1.6. Dữ liệu tính toán ước lượng hàm đặc trưng câu hỏi

49

Nhƣ vậy chỉ số là quá lớn ta phải thay đổi tham số b (theo hai chiều hƣớng:

tăng lên và giảm đi) ví dụ b=1.51.451.4…1, giảm (tăng) đến khi chỉ số

nhỏ trong ngƣỡng cho phép. Quá trình kết thúc khi các ứng đáp câu hỏi quan sát đƣợc

và ƣớc lƣợng tham của câu hỏi có đồ thị “tiệm cận” với nhau nhƣ hình vẽ.

Hình 1.15. Đồ thị của hàm đặc trưng câu hỏi

Nếu quá trình trên không thu đƣợc hợp lý thì hoặc là ta bỏ câu hỏi thi, hai là

ta sửa lại câu hỏi.

Lƣu ý quá trình ƣớc lƣợng trên không phụ thuộc vào mẫu (nếu mẫu có năng lực

thấp, hay năng lực cao đều không ảnh hƣởng tới quá trình ƣớc lƣợng tham số). Đây là

một ƣu điểm nổi bất của IRT. Nó giúp ta có thể ƣớc lƣợng đề thi với các mẫu không

phổ quát mà vẫn không lo ảnh hƣởng tới chất lƣợng đề thi.

Dƣới đây là hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu khác nhau

50

Hình 1.16.. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực thấp

Hình 1.17. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực cao

Hình 1.18. Hình ảnh ước lượng tham số câu hỏi với tập mẫu có năng lực phổ quát 51

Khi tất cả các câu hỏi trong đề thi đƣợc ƣớc lƣợng tham số, tức là với mỗi câu

hỏi i nào đó ta có hàm đặc trƣng của nó: . Trong một đề có N câu

hỏi thi, ta sẽ có tƣơng ứng n hàm đặc trƣng cho từng câu hỏi thi.

Mặc dù giả định rằng thang đo số liệu đƣợc biết đến, các giá trị số của các tham

số câu hỏi thi và các thông số về khả năng của ngƣời kiểm tra có thể đƣợc thể hiện

bằng số liệu này. Các nhà soạn đề thi cần biết những đặc tính nào họ cần đo lƣờng về

thí sinh để thiết kế các hỏi thi phù hợp cho những thí sinh có khả năng thấp, trung bình

hoặc cao. Nhƣng không thể xác định các giá trị của các tham số của độ phân biệt a

giữa các nhóm thí sinh cần đo. Ngoài ra, khi một bài kiểm tra đƣợc thực hiện cho một

nhóm thí sinh, không biết trƣớc bao nhiêu của các đặc điểm tiềm ẩn của mỗi ngƣời thí

sinh sở hữu. Do đó, một nhiệm vụ chính là xác định các giá trị của tham số câu hỏi và

khả năng của thí sinh trong một câu hỏi cho các đặc điểm ẩn tiềm ẩn. Trong IRT,

nhiệm vụ này là đƣợc gọi là hiệu chuẩn kiểm tra, và nó cung cấp một khung tham khảo

để giải thích các kết quả kiểm tra. Kiểm tra hiệu chuẩn đƣợc thực hiện bằng cách thực

hiện một bài kiểm tra cho một nhóm thí sinh M và câu trả lời nhị phân của thí sinh đối

với N câu hỏi trong đề thi. Sau đó các công thức, thủ tục toán học đƣợc áp dụng cho

dữ liệu ứng đáp câu hỏi để tạo ra mô hình năng lực, mô phỏng bám sát năng lực tiềm

ẩn của thí sinh. Sau đó, các giá trị của ƣớc lƣợng tham số câu hỏi và năng lực của thí

sinh đƣợc thể hiện bằng số liệu này.

52

CHƢƠNG 2

TỔ CHỨC VÀ THỰC HIỆN XÂY DỰNG ĐỀ THI

2.1. Đặt vấn đề

Cho đến nay các loại lý thuyết đo lƣờng và các mô hình đo lƣờng khác nhau đã

đƣợc giới thiệu rộng rãi ở Việt Nam trong. Với mong muốn tiếp cận lý thuyết khảo thí

hiện đại, luận văn này dự định tập trung vào nghiên cứu trong lĩnh vực kiểm tra môn

toán học lớp 12 bằng lý thuyết IRT. Lý thuyết IRT đã đƣợc biết đến từ những năm 50

của thế kỷ trƣớc và đƣợc giới thiệu về Việt Nam từ những năm 2000, nhƣng hiện nay

việc xây dựng một đề thi trên cơ sở lý thuyết IRT vẫn chƣa đƣợc phổ biến. Cách xây

dựng đề thi vẫn chủ yếu theo lý thuyết đánh giá cổ điển (các kì thi THPT QG là ví dụ),

IRT mới chủ yếu đƣợc ứng dụng trong các phân tích kết quả thi. Có nhiều lý do cho

vấn đề này. Thực ra các lý thuyết kiểm tra cổ điển và lý thuyết IRT không loại trừ, đối

lập nhau mà thƣờng bổ xung các ƣu điểm cho nhau. Mặt khác việc thực thi, ứng dụng

lý thuyết IRT vào việc xây dựng đề thi ở Việt Nam gặp nhiều khó khăn. Thứ nhất là

đội ngũ nghiên cứu chuyên sâu ở trong nƣớc là chƣa nhiều, chƣa có cộng đồng. Thứ

hai các mô hình toán học phức tạp trong IRT cần có những công cụ, phần mềm chuyên

dụng để tính toán. Thứ ba lý thuyết đánh giá cổ điển vẫn đáp ứng tƣơng đối tốt các yêu

cầu từ các kỳ thi của bộ giáo dục.

Tuy vậy, thực tế đo lƣờng trong giáo dục là vấn đề ngày càng đƣợc quan tâm

sát sao trƣớc yêu cầu đổi mới kiểm tra đánh giá trong giáo dục. Các nền tảng của đo

lƣờng đánh giá đƣợc biết đến hiện nay hoặc là dựa trên lý thuyết kiểm tra cổ điển hoặc

dựa trên IRT hoặc là sự kết hợp của cả hai. Dựa trên các hiểu biết hạn hẹp của cá nhân,

luận văn cố gắng xây dựng một đề đánh giá môn toán lớp 12 trên cở sở của lý thuyết

khảo thí hiện đại.

2.2. Quy trình xây dựng một đề thi, đề kiểm tra

Một đề kiểm tra tiêu chuẩn hóa thƣờng đƣợc thiết kế bởi các câu hỏi (CH) chọn

từ một ngân hàng câu hỏi (NHCH). NHCH là tập hợp một số lƣợng tƣơng đối lớn các

câu hỏi, trong đó mỗi CH đƣợc mô tả gắn với các phần nội dung xác định và các tham

số của nó. Trong trƣờng hợp CH trắc nghiệm thì đó là độ khó, độ phân biệt theo lý

53

thuyết trắc nghiệm cổ điển, là các tham số a, b, c theo IRT. Ngoài ra NHCH phải đƣợc

thiết kế sao cho trên đó có thể thực hiện các thao tác loại trừ hoặc thay đổi các CH

“xấu”, bổ xung các CH tốt để số lƣợng và chất lƣợng câu hỏi ngày càng tăng lên. [A4].

Thiết kế một đề kiểm tra tiêu chuẩn hóa và một NHCH là khá phức tạp và tốn nhiều

công sức, trí lực và thời gian. Trong luận văn này, sẽ xem xét việc thiết kế đề kiểm tra

tổng kết môn Toán lớp 12. Có thể tóm tắt các bƣớc đó nhƣ sau:

1) Tên đề thi

2) Mục đích đề thi, đề kiểm tra.

3) Khối lƣợng kiến thức, kĩ năng cần đo lƣờng

4) Đối tƣợng đo lƣờng

5) Những loại hình kiểm tra/ thi thực hiện

6) Mục đích sử dụng kết quả thi

7) Thời gian thi

8) Bảng ma trận trọng số

9) Biên soạn đề

10) Đề thi và đáp án.

Để thực hiện các bƣớc của quy trình trên, chúng ta cần xác định các nội dung

chi tiết của môn học, các mức độ nhận thức mong muốn TS đạt đƣợc rồi từ đó xây

dựng ma trân kiến thức của môn học. Dựa vào các đặc điểm của kì thi, phân bố thời

lƣợng nội dung kiểm tra mà ta phân bố tỉ lệ các CH hợp lí. Việc phân công, chế tác các

CH thi cũng rất quan trọng. Mọi ngƣời đƣợc phân công biên soạn CH phải có năng

lực chuyên môn vững vàng, nắm chắc các ô ma trận kiến thức để biên soạn các CH

một cách chính xác và tốt nhất. Ngoài ra việc phản biện chuyên gia, lập các đề thi thử

với các CH đã đƣợc soạn cũng phải làm hết sức nghiêm túc, khoa học. Những ngƣời

quan tâm đến việc xây dựng một bài kiểm tra phải đối mặt với những khó khăn thử

thách liên quan nhƣ: Đánh giá cái gì, đánh giá nhƣ thế nào, và liệu các test có tin cậy

hay không, có cơ sở vững chắc không. Đó là những thử thách cơ bản đối với ngƣời

giáo viên xây dựng test cho chính mình.

54

Trắc nghiệm tiêu chuẩn hoá thƣờng do các chuyên gia phụ trách chuyên môn

đặc thù soạn thảo, và phải kiểm thử nhiều lần, do đó mỗi câu hỏi trắc nghiệm đƣợc gắn

với các chỉ số cho biết thuộc tính và chất lƣợng của nó nhƣ độ khó, độ phân biệt.

Trong các kiểu câu trắc nghiệm, kiểu câu nhiều lựa chọn có cách trả lời đơn

giản nhất. Câu đúng - sai là một trƣờng hợp riêng của câu nhiều lựa chọn với hai

phƣơng án trả lời. Dễ dàng thấy rằng khi một ngƣời hoàn toàn không có hiểu biết đánh

dấu hú hoạ để trả lời một câu hỏi đúng - sai thì xác suất để anh ta làm đúng là 1/2 hoặc

50%, cũng vậy nếu anh ta đánh dấu hú hoạ để trả lời câu trắc nghiệm với n phƣơng án

trả lời thì xác suất để anh ta làm đúng là 1/n. Trong các kiểu câu trắc nghiệm, kiểu câu

nhiều lựa chọn thƣờng đƣợc sử dụng vì chúng có cấu trúc đơn giản, dễ xây dựng thành

các bài thi, dễ chấm điểm. Về vị trí quan trọng của kiểu câu hỏi NLC nêu dƣới đây

chúng ta sẽ nói kỹ hơn về chúng. Loại câu trắc nghiệm nhiều lựa thƣờng đƣợc dùng

trong các kì thi là loại có bốn phƣơng án trả lời, vì số phƣơng án nhƣ vậy vừa đủ để

giảm xác suất làm đúng do đoán mò hú hoạ xuống còn 25%, đồng thời câu cũng không

quá phức tạp khó xây dựng. Câu trắc nghiệm nhiều lựa chọn cung cấp thông tin cần

thiết hoặc nêu một câu hỏi và các phƣơng án để chọn, và đƣợc đánh dấu bằng các chữ

cái A, B, C, D... hoặc các chữ số 1, 2, 3... trong các phƣơng án để chọn và chỉ có duy

nhất một phƣơng án đúng, các phƣơng án khác đƣợc đƣa vào có tác dụng “gây nhiễu”

(distractor) đối với thí sinh. Nếu câu NLC đƣợc soạn tốt thì một ngƣời không nắm

vững vấn đề sẽ không thể nhận biết đƣợc trong tất cả các phƣơng án để chọn đâu là

phƣơng án đúng, đâu là phƣơng án nhiễu. Một số chuyên gia trắc nghiệm ở phía Nam

còn gọi các phƣơng án nhiễu là “mồi nhử”.

Trong khi soạn thảo câu trắc nghiệm, ngƣời ta thƣờng cố gắng làm cho các

phƣơng án nhiễu đều có vẻ “có lý” và “hấp dẫn” nhƣ phƣơng án đúng. Đôi với tất cả

các môn học ngƣời ta đều có thể viết câu hỏi trắc nghiệm. Tuy nhiên, do đặc thù của

từng môn học mà việc viết trắc nghiệm cho môn này có thể khó hơn cho môn kia. Cần

lƣu ý rằng không phải bất cứ ai có kiến thức chuyên môn cũng viết đƣợc câu trắc

nghiệm có chất lƣợng cao cho chuyên môn đó. Muốn viết câu hỏi trắc nghiệm tốt phải

suy nghĩ sâu sắc về chuyên môn và tích lũy kinh nghiệm sau một thời gian thử nghiệm

lâu dài.

2.2.1. Qui trình xây dựng ngân hàng câu hỏi trắc nghiệm khách quan

55

Nhƣ đã nói ở phần trên, để hoàn thiện các bài trắc nghiệm ngƣời ta phải triển

khai các trắc nghiệm thử. Thử nghiệm các câu hỏi trắc nghiệm nhằm tìm ra các các hỏi

xấu và định cỡ về độ khó cho đề trắc nghiệm. Phép đo này có thể thực hiện đƣợc nhờ

hiệu phép thống kê. Để đo đƣợc năng lực thí sinh, thƣớc đo - bài trắc nghiệm phải

đƣợc định cỡ (calibrration) tỉ mỉ, tức là phải biết đƣợc các độ khó, độ phân biệt của các

câu, độ tin cậy và độ giá trị của bài trắc nghiệm. Tuy chƣa đƣợc định cỡ nhƣ vậy, qua

nhiều bƣớc soạn thảo ngân hàng câu hỏi theo quy trình nhƣ nêu ở phần đầu, bài trắc

nghiệm cũng đã tƣơng đối đảm bảo chất lƣợng để có thể phân loại đƣợc thí sinh.

Những thí sinh nào làm đúng nhiều câu hỏi, họ thuộc nhóm nhóm giỏi, những thí sinh

làm đúng ít câu hỏi, họ thuộc nhóm kém. Nhƣ vậy, dựa vào điểm số của toàn bài trắc

nghiệm nhƣ một thƣớc đo để định cỡ các câu và bài trắc nghiệm.

Cần lƣu ý một điều là khi dùng từ “trắc nghiệm thử” thì chữ “thử” chỉ có ý

nghĩa về chuyên môn trong thiết kế và định cỡ trắc nghiệm, còn trong cuộc sống phải

tạo tình huống để mọi thí sinh để coi lần trắc nghiệm đó là thật, vì có nhƣ vậy thì họ

mới làm nghiêm túc, hết mình và phép thử mới đạt yêu cầu.

Dựa vào kết quả trắc nghiệm thử ngƣời ta có thể tính bằng tay để phân tính bài

các câu và bài trắc nghiệm, cũng có thể nhờ các phần mềm giúp tính rất nhanh chóng

các đại lƣợng cần thiết nhờ các phép tính thống kê tƣơng quan cổ điển, hoặc các phần

mềm đƣợc xây dựng theo các mô hình toán học về đo lƣờng giáo dục. [6]

2.2.2. Quy trình triển khai một kỳ thi trắc nghiệm khách quan

Quy trình tổ chức xây dựng đề và tổ chức kỳ thi trắc nghiệm tiêu chuẩn hoá rất

phức tạp. Có thể tóm tắt các bƣớc của quy trình đó nhƣ sau:

(1) Xác định các môn thi và những nội dung tổng quát cần kiểm tra đối với từng

môn. Đồng thời, định ra yêu cầu về các mức kỹ năng, chẳng hạn: nhớ, hiểu, biết vận

dụng, phân tích, tổng hợp... Để thực hiện bƣớc này ngƣời ta thƣờng lập một ma trận 2

chiều: các dòng phân theo các phần nội dung, các cột phân theo các mức kỹ năng,

trong mỗi ô ghi số câu hỏi cần thiết (hoặc tỷ lệ phần trăm) của phần nội dung và mức

kỹ năng tƣơng ứng.

(2) Phân công cho các giáo viên, viết một số câu trắc nghiệm theo các yêu cầu

cụ thể về nội dung và mức kỹ năng đã xác định theo các bảng, mẫu quy ƣớc.

56

(3) Trao đổi trong từng nhóm biên soạn giúp các tác giả phát hiện và sửa chữa

đƣợc nhiều sai sót mà bản thân không cảm thấy.

(4) Biên tập và đƣa các câu trắc nghiệm vào "ngân hàng" lƣu trong máy tính

theo quy tắc và quy ƣớc sẵn. Ngân hàng câu hỏi thƣờng đƣợc quản lý bằng một phần

mềm chuyên dụng.

(5) Lập đề thi mẫu và tổ chức thử nghiệm trên một mẫu đại diện.

(6) Chấm thi và thống kê, phân tích các kết quả thi thử nhằm xác định độ khó,

độ phân biệt, qua đó có thể đánh giá độ tin cậy của câu hỏi, đề thi trắc nghiệm.

(7) Thay thế, chỉnh sửa các câu hỏi kém chất lƣợng và nhập các câu hỏi chất

lƣợng vào ngân hàng đề thi.

(8) Ra đề thi chính thức: căn cứ vào cấu trúc đề thi (phân bố câu theo nội dung

và mức độ kỹ năng tƣơng ứng bảng ma trân đặc trƣng), nhờ phần mềm tin học để chọn

một cách ngẫu nhiên từ ngân hàng số câu hỏi cần thiết với các đặc trƣng xác định (độ

khó, độ phân biệt, mức kỹ năng) để lập nên một đề thi. Các công cụ phần mềm sẽ giúp

ta xây dựng các đề tƣơng đƣơng một cách đơn, nhẹ nhàng (đảo câu, đảo đáp án,…)

(9) In đề thi và tổ chức thi: đề thi đƣợc in sẵn, phát cho từng thí sinh trong

phòng thi.

(10) Chấm và phân tích thống kê các kết quả thi: ngày nay ngƣời ta có thể chấm

lại trắc nghiệm trên các hệ thống tự động gồm một máy quét quang học và máy tính có

phần mềm tin học hỗ trợ việc chấm thi.

(11) Công bố kết quả thi.

Để xây dựng đƣợc ngân hàng câu hỏi thi phong phú, ta cần lặp đi, lặp lại các

bƣớc ở trên để từ đó liên tục bổ xung các hỏi tốt và loại trừ các câu hỏi xấu, câu hỏi đã

dùng hoặc lỗi thời . Qua đó có thể thấy rằng ngân hàng các câu trắc nghiệm không

phải là kho lƣu trữ bất động mà nhƣ một cơ thể sống, luôn đƣợc bổ sung, loại bỏ, hoàn

thiện và phát triển. [3]

Cần phải nhấn mạnh rằng các câu trắc nghiệm tiêu chuẩn hoá trong ngân hàng

và đề thi trắc nghiệm phải đƣợc bảo mật trƣớc khi đem ra sử dụng. Những đề thi và

57

những câu hỏi đã đƣợc dùng chính thức thƣờng đƣợc công bố ở các tài liệu dùng cho

tham khảo hoặc luyện thi.

Một tác dụng hết sức quan trong của các kỳ thi đại trà bằng trắc nghiệm tiêu

chuẩn hoá là những thông tin thu đƣợc qua việc phân tích thống kế toàn bộ bài làm của

thí sinh qua các kỳ thi là những số liệu hết sức quý báu để đánh giá định lƣợng về tình

hình giáo dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu

thế phát triển của chất lƣợng giáo dục theo thời gian.

2.3. Xây dựng đề thi môn toán

Ngƣời ta có thể áp dụng phƣơng pháp trắc nghiệm để tổ chức thi, kiểm tra ở các

lớp học thông thƣờng với số thi sinh không quá lớn, cũng có thể áp dụng ở các kỳ thi

quy mô lớn hàng nghìn, hàng vạn thí sinh. Trong trƣờng hợp sau, bất kỳ một sơ suất

nhỏ nào cũng có thể dẫn đến những hậu quả xấu và những phản ứng xã hội bất lợi. Do

đó, để triển khai một kỳ thi quy mô lớn ngƣời ta phải chuẩn bị hết sức cẩn thận về đề

thi quy trình thi, thể thức chấm điểm, cách công bố kết quả... Quá trình chuẩn bị đó hết

sức công phu và tốn kém mà một kỳ thi thông thƣờng ở lớp học không thể làm nổi. Ta

có chu trình xây dựng nhƣ sau:

Bảng 2.1 Quy trình xây dựng đề thi

58

Kỳ thi đƣợc chuẩn bị công phu nhƣ vậy đƣợc coi là kỳ thi tiêu chuẩn hoá.

Các câu hỏi trong một đề thi tiêu chuẩn hoá là các câu hỏi đã đƣợc thử nghiệm, định

cỡ trên cơ sở phân tích các tham số độ khó, độ phân biệt, độ tin cậy, độ giá trị của từng

câu.

2.3.1. Chuẩn bị

Để xây dựng đề thi một cách chuẩn mực và khoa học ta cần làm rõ các bƣớc

các vấn đề sau:

(1) Tên đề thi : “ Kiểm tra môn toán học lớp 12”

(2) Mục đích đề thi, đề kiểm tra: “ Đánh giá, kiểm tra kiến thức môn toán lớp

12 của học sinh THPT”

59

(3) Khối lƣợng kiến thức, kĩ năng cần đo lƣờng: “ Toàn bộ chƣơng trình toán 12

theo chuẩn kiến thức, kĩ năng của BGD”

(4) Đối tƣợng đo lƣờng: “ Học sinh học hết chƣơng trình toán 12”

(5) Những loại hình kiểm tra/ thi thực hiện: “Dựa vào các phân tích ở các phần

trên ta chọn hình thức thi trắc nghiệm đa lựa chọn – bốn lựa chọn”

(6) Mục đích sử dụng kết quả thi: Kết quả thi đƣợc sử dụng để xét tốt nghiệp

THPT của thí sinh và tuyển sinh đầu vào cho các trƣờng đại học tại Việt Nam.

(7) Thời gian thi: 90 phút

2.3.2. Xây dựng bảng ma trận trọng số

Để xây dựng bảng ma trận trọng số của đề thi ta dựa vào các tài liệu sau:

(1) Hƣớng dẫn chuẩn kiến thức kĩ năng toán 12 do bộ giáo dục phát hành năm

2006 [9]

(2) Phân phối chƣơng trình chuẩn toán 12 – phụ lục 1.

(3) Dựa vào phân bố thời gian, nội dung kiến thức và mục địch sử dụng kết quả

thi ta xây dựng ma trận trọng số các câu hỏi thi nhƣ sau:

60

Bảng 2.2. Ma trận đề thi môn toán 12

MA TRẬN ĐỀ THI MÔN TOÁN LỚP 12

Mức độ kiến thức đánh giá Tổng số

Vận câu hỏi STT Các chủ đề Nhận Thông Vận dụng biết hiểu dụng cao

1 Hàm số và các bài toán liên 4 4 2 11 1

quan

10 1 4 1 2 Mũ và Lôgarit 4

7 1 3 1 3 Nguyên hàm – Tích phân và 2

ứng dụng

6 0 2 1 4 Số phức 3

5 1 2 1 5 Thể tích khối đa diện 1

3 0 1 1 6 Khối tròn xoay 1

8 1 2 1 7 Phƣơng pháp tọa độ trong 4

không gian

5 19 18 8 50 Số câu

Tổng

38 % 36 % 16 % 10 % Tỷ lệ

Để chuẩn bị cho việc biên soạn câu hỏi ta chuẩn bị bảng đặc tả về nội dung môn

toán lớp 12. Phụ lục 2. Từ đó ta có bảng mô tả mức độ các câu hỏi (mặc định mỗi câu

hỏi 1 điểm ) nhƣ sau:

61

Bảng 2.3 Bảng mô tả chi tiết từng câu hỏi trong đề thi

BẢNG MÔ TẢ CHI TIẾT NỘI DUNG TỪNG CÂU HỎI

CHỦ ĐỀ CÂU MÔ TẢ

Nhận biết: Nhận biết đồ thị của hàm số bậc ba, bậc 4 trùng

phƣơng, hàm số , tƣơng giao giữa các đồ thị đơn

giản.

Nhận biết: Xác định khoảng đồng biến , nghich biến của

hàm số bậc ba, hàm bậc bốn trùng phƣơng thông qua bảng

biến thiên của hàm số.

Nhận biết: Nhận biết cực trị của hàm số bậc ba, bậc bốn

thông qua bảng biến thiên

1. Ứng dụng

Nhận biết: Nhận biết phƣơng trình tiệm cận đứng và ngang đạo hàm để

khảo sát và của đồ thị hàm số

vẽ đồ thị của

hàm số Thông hiểu: Tìm điều kiện của tham số để hàm số đạt cực

(11 câu) trị tại ; số cực trị của hàm số

Thông hiểu: Tìm khoảng đồng biến, nghịch biến của một

hàm số hoặc nhận dạng đồ thị hàm số qua chiều biến thiên

của nó.

Thông hiểu: Tìm GTLN của hàm số trên một đoạn

Thông hiểu: Tìm điều kiện của các tham số để hàm số

đồng biến, nghịch biến trên các khoảng xác định

của nó

62

Vận dụng: Xác định tham số để hàm số bậc ba, bậc bốn

trùng phƣơng có điểm cực trị ,cực đại, cực tiểu thỏa mãn điều

kiện cho trƣớc có liên qua đến khoảng cách, tam giác

Vận dụng: Tìm điều kiện của tham số để hàm số đồng biến,

nghịch biến trên một khoảng hoặc Tìm điều kiện của tham số

đề đồ thị hàm số và đƣờng thẳng cắt nhau tại hai điểm phân

biệt thỏa mãn điều kiện cho trƣớc

Vận dụng cao: Tìm điều kiện của tham số hàm số lƣợng giác

có tham số đồng biến, nghịch biến trên một khoảng hoặc

GTLN-GTNN, ứng dụng thực tế

Nhận biết: Định nghĩa, tính chất của lôgarit. Tính chất của

hàm số lôgarit, đạo hàm của hàm số logarit

Nhận biết: Tính chất của hàm số mũ,đạo hàm của hàm số

mũ,

Nhận biết: Tính chất của hàm số lũy thừa, tập xác định của

hàm số lũy thừa, đạo hàm của hàm số lũy thừa 2. Hàm số

luỹ thừa - Nhận biết: Cách giải phƣơng trình mũ cơ bản, phƣơng trình hàm số mũ lôgarit cơ bản và hàm số

lôgarit Thông hiểu: Giải các phƣơng trình mũ, lôgarit dạng thƣờng

gặp (10 câu)

Thông hiểu: Sử dụng công thức mũ, logarit biến đổi các

biểu thức mũ logarit

Thông hiểu: Giải các bất phƣơng trình mũ , logarit dạng

thƣờng gặp . Tìm tập xác định của hàm số hàm số logarit

Thông hiểu: Đạo hàm, tính chất của hàm số mũ, logarit, lũy

63

thừa dạng hàm hợp. Tập xác định của hàm số hợp của hàm số

lũy thữa

Vận dụng: Phƣơng trình , bất phƣơng trình ,hệ phƣơng trình

mũ chứa tham số, Phƣơng trình, bất phƣơng trình , hệ

phƣơng trình lôgarit chứa tham số

Vận dụng cao: Sử dụng công thức mũ,logarit, tính chất hàm

số mũ, logarit trong các bài toán về tính chất , giá trị lớn nhất

, nhỏ nhất của hàm số hợp của hàm số mũ, hàm số logarit,

Phƣơng trình mũ phức tạp, các ứng dụng thực tế

Nhận biết: Tìm họ nguyên hàm dựa vào bảng nguyên hàm

Nhận biết : Tìm họ nguyên hàm của hàm số dựa vào bảng

nguyên hàm, tính chất nguyên hàm

3. Nguyên Thông hiểu: Tính tích phân của hàm số

hàm - tích Thông hiểu: Tìm một nguyên hàm của hàm số có điều kiện phân và ứng

dụng Thông hiểu: Sử dụng tìm nguyên hàm với các câu hỏi khác

(7 câu) Vận dụng: Tính tích phân , ứng dụng của tích phân

Vận dụng cao: Sử dụng tìm nguyên hàm, tính tích phân của

hàm số với các bài toán liên quan khác. Ứng dụng vào bài

toán thực tế

Nhận biết: Xác định các tham số cơ bản của số phức

Nhận biết: Các phép toán cơ bản với số phức

4. Số phức (6

Nhận biết: Các dạng biểu diễn của số phức câu)

Thông hiểu: Nghiệm phƣơng trình bậc nhất, bậc hai hệ số

thực của số phức.

64

Thông hiểu: Các bài toán liên quan đến môđun, đến tính

toán biểu thức phức

Vận dụng: Các tính toán phức tạp, các bài toán hình học liên

quan đến mô đun số phức.

Nhận biết: Thể tích khối chóp dễ xác định đƣờng cao, diện

tích đáy. Thể tích khối lăng trụ đứng dễ xác định đƣờng cao,

diện tích đáy

Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố

cạnh hoặc góc đơn giản . Tính thể tích khối lăng trụ đứng có

liên quan đến yếu tố cạnh hoặc góc đơn giản

Thông hiểu: Các khái niệm liên quan đến khối đa diện: Mặt,

5. Thể tích cạnh, đỉnh, mặt đối xứng,…, đa diện đều.

khối đa diện Vận dụng: Tính thể tích khối chóp có sử dụng kiến thức ở

(5 câu) mức độ cao hơn về quan hệ vuông góc, góc, khoảng cách để

xác định đƣờng cao, diện tích đáy. Tính thể tích khối lăng trụ

có sử dụng kiến thức ở mức độ cao hơn về quan hệ vuông

góc, góc, khoảng cách để xác định đƣờng cao, diện tích đáy.

Tính thể tích khối lăng trụ, khối hộp xiên

Vận dụng cao: Tính thể tích khối chóp không xác định trực

tiếp phải sử dụng thông qua tỉ số thể tích, phân chia khối đa

diện. Cực trị khối đa diện.

Nhận biết: Công thức thể tích, diện tích liên quan đến khối

nón, khối trụ, khối cầu. 6. Khối tròn

xoay Thông hiểu: Khối nón có liên quan thiết diện. Khối trụ có

liên quan thiết diện (3 câu)

Vận dụng: Xác định tâm và tính bán kính mặt cầu ngoại tiếp

65

khối chóp. Nón, trụ có liên quan đến góc, khoảng cách, thiết

diện. Thể tích khối trụ, diện tích xung quanh ,diện tích toàn

phần hình trụ- Bài toán thực tế.

Nhận biết: Các phép toán về véc tơ, điểm.

Nhận biết: Viết, xác định phƣơng trình mặt phẳng khi biết

một điểm và một vec tơ pháp tuyến

Nhận biết: Viết, xác định phƣơng trình đƣờng thẳng khi biết

một điểm và một vectơ chỉ phƣơng

Nhận biết: Viết phƣơng trình mặt cầu khi biết tâm và bán

kính.

7. Phƣơng Thông hiểu: Các bài toán viết phƣơng trình mặt phẳng, pháp tọa độ đƣờng thẳng cần xác định đƣợc vectơ pháp tuyến hay chỉ trong không phƣơng liên quan điểm các đƣờng thẳng, mặt phẳng đặc gian biệt.(hình chiếu, khoảng cách từ điểm lên các trục Ox, hay

(8 câu) mặt phẳng (Oxy)

Thông hiểu: Các bài toán liên quan đến tƣơng giao, hình

chiếu, khoảng cách của điểm, đƣờng thẳng, mặt phẳng.

Vận dụng: Các bài toán tìm điểm trên mặt phẳng, đƣờng

thẳng,… thỏa mãn các điều kiện cho trƣớc.

Vận dụng cao: Ứng dụng hình giải tích vào hình không gian

hoặc xử lý các bài toán cực trị hình học liên quan đến véc tơ,

điểm, mặt phẳng, mặt cầu, đƣờng thẳng.

66

2.3.3. Biên soạn câu hỏi thi

Để biên soạn câu hỏi thi ta làm theo quy trình sau:

Bảng 2.4. Quy trình biên soạn câu hỏi thi

67

Ta xây dựng từng câu hỏi thi theo quy ƣớc đánh mã từ 1 – 50 cho các loại câu hỏi thi. Khi đó ta biên soạn từng mã câu hỏi thi nhƣ sau:

Mã số 1. KH: HS.A1.STT ( Câu hỏi hàm số mức độ dễ (A) loại 1 gắn với số thứ tự của câu hỏi.

Yêu cầu: Nhận biết: Nhận biết đồ thị của hàm số bậc ba, bậc 4 trùng phƣơng , hàm số , tƣơng giao giữa các đồ thị đơn giản.

Bảng 2.5. Bảng xây dựng câu hỏi thi

TT Nội dung Đáp án Nhiễu 1 Nhiễu 2 Nhiễu 3 Ghi chú

Đƣờng cong trong

hình bên là đồ thị của

một trong bốn hàm số Chú ý: Các

đƣợc liệt kê ở bốn lỗi, bẫy học HS.A1.1

phƣơng án A, B, C, sinh

D. Hỏi hàm số đó là

hàm số nào ?

Hình bên là đồ thị

của hàm số nào HS.A1.2 dƣới đây ?

Đƣờng cong

dƣới đây là

đồ thị của HS.A1.3

hàm số nào ?

Đồ thị của hàm số và

đồ thị của hàm số Bốn. Một. Hai. Ba. HS.A1.4

có bao nhiêu

điểm chung ?

Đƣờng cong ở

hình bên là đồ

thị của một

trong bốn hàm HS.A1.5

số ở dƣới

đây. Hàm số đó là hàm số nào ?

69

HS.A1.6 Đƣờng cong ở hình bên là

đồ thị của một trong bốn

hàm số ở dƣới

đây. Hàm số đó là hàm số nào ?

HS.A1.7 Cho hàm số có đồ cắt trục cắt trục cắt trục không cắt thị (C). Mệnh đề nào dƣới đây đúng ? hoành tại một hoành tại hai hoành tại ba trục hoành. điểm. điểm điểm.

…

70

Mã số 36. KH: ĐD.B1.STT ( Câu hỏi khối đa diện mức độ thông hiểu (B) loại 1 gắn với số thứ tự của câu hỏi.

Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố cạnh hoặc góc đơn giản . Tính thể tích khối lăng trụ đứng có liên quan đến

yếu tố cạnh hoặc góc đơn giản

TT Nội dung Đáp án Nhiễu 1 Nhiễu 2 Nhiễu 3 Ghi chú

Cho khối chóp tam giác đều S.ABC có cạnh đáy bằng a

và cạnh bên bằng 2a. Tính thể tích V của khối chóp ĐD.B1.1

S.ABC.

Cho hình chóp tứ giác đều có cạnh đáy bằng

ĐD.B1.2 cạnh bên bằng Tính thể tích V của khối chóp đã

cho.

Cho khối chóp S.ABCD có đáy là hình vuông cạnh a, SA

vuông góc với (ABCD) và SC tạo với mặt phẳng (ABC) ĐD.B1.3

một góc . Tính thể tích V của khối chóp đã cho.

71

Hình chóp S.ABC có đáy là tam giác ABC đều cạnh a.

Hình chiếu vuông góc của S trên mặt phẳng (ABC) là ĐD.B1.4 trung điểm H của cạnh AB, cạnh bên SC tạo với đáy một

góc . Thể tích khối chóp S.ABC là

Cho hình lăng trụ có thể tích bằng 12 và

đáy ABCD là hình vuông tâm O. Tính thể tích khối chóp ĐD.B1.5

ĐD.B1.6 Cho hình chóp có đáy là tam giác vuông

cân tại B với biết vuông góc với (ABC) và

hợp với đáy một góc 60o. Thể tích khối chóp là:

ĐD.B1.7 Cho hình lăng trụ , có

, cạnh bên hợp với mặt

phẳng đáy một góc . Biết hình chiếu vuông góc của

trên trùng với trọng tâm của tam giác .

Thể tích của khối đa diện tính theo bằng .

72

73

74

2.4. Thử nghiệm đề thi

Quá trình thử nghiệm đƣợc diễn ra sau khi hoàn thiện công tác xây dựng đề

thi. Quá trình thử nghiệm cần in ấn đề thi và phiếu trả lời theo mẫu chuẩn giúp quá

trình nhập dữ liệu đƣợc đơn giản.

2.4.1. Chọn mẫu nghiên cứu

Mẫu HS đƣợc chọn là học sinh lớp 12, đã hoàn thành chƣơng trình toán 12.

Dựa trên điều kiện thực tế của tác giả, số lƣợng HS đƣợc chọn khoảng 200 HS với

bốn đề đã đƣợc xây dựng. Bốn đề đƣợc thử nghiệm cùng nhau (chia làm 4 mã đề

001, 002, 003, 004) với mỗi mẫu. Các học sinh đƣợc chọn thử nghiệm là các nhóm

HS ở lớp 12A4 Xuân đỉnh - 40hs (Hà Nội), 12A1 Vinschool - 35HS, 12A1 CVP -

35HS (Vĩnh Phúc ), 12B6 Trần Hƣng Đạo – 45HS, 12A8 Xuân Trƣờng - 45HS

(Nam Định)

2.4.2. Kế hoạch thực hiện

Để đảm bảo tính nghiêm túc, và tính tin cậy, đề thử nghiệm đƣợc thực hiện

trong khoảng thời gian từ 10 – 4 – 2017 đến ngày 25 – 4 – 2017. Đây là thời gian

các HS đã hoàn thành chƣơng lớp 12, nhƣng chƣa thi hết học kì. Điều này là quan

trọng, bởi kết quả bài thi cần phản ánh chính xác năng lực của TS tham gia dự thi.

Một khó khăn trong quá trình lấy mẫu là thời gian lấy mẫu chỉ diễn ra trong một

khảng thời gian rất ngắn (2 tuần), ngoài khoảng thời gian này, kết quả lấy mẫu

không cho kết quả tốt. Kết quả thử nghiệm ban đầu có các câu hỏi tự luận và các

câu hỏi trả lời ngắn. Nhƣng do hình thức thi trung học quốc gia thay đổi, nên thái độ

làm bài của TS không tốt, dẫn đến kết quả thu đƣợc không đạt yêu cầu. Do đó phân

tích câu hỏi thi đa phân đã không thực hiện đƣợc. Đây là một điều hết sức đáng tiếc.

Bởi phân tích các câu hỏi đa phân là một ƣu điểm của lý thuyết IRT mà trong CTT

không có.

2.4.3. Kết quả thử nghiệm.

Sau quá trình trình biên soạn câu hỏi thi theo mẫu phụ lục 4 ta đƣợc 4 mã đề

thi: Đề số 1, đề số 2, đề số 3, đề số 4 (các câu hỏi trong các đề thi có thể trùng

nhau). Thứ tự các câu hỏi trong mỗi đề thi đƣợc trộn đánh số từ 1 – 50. Nhƣng để

thuận tiện cho việc phân tích chỉ số các câu hỏi chúng ta sẽ sắp xếp lại theo bảng

mô tả chỉ tiết từng câu hỏi. Kết quả kiểm tra thu đƣợc lƣu trong file excel với mỗi

đề thi, kết quả thử nghiệm đƣợc lƣu theo định dạng sau.

Bảng 2.6. Mẫu lưu kết quả câu hỏi thi

STT Câu 1 Câu 2 Câu 3 … Câu 49 Câu 50

ĐA B A D A C B

Hs.1 B A B A D A

Hs.2 C B C B A D

Hs.3 B C C D A D

…

Hs.N A D D A C B

Hs.(N+1) B D A B C D

Cột 1. Là số thứ tự tƣơng ứng của TS đƣợc kiểm tra. Dòng 2 lƣu đáp án của đề thi.

Từ dòng 3 trở đi là số thứ tự tƣơng ứng với số báo danh của TS.

Từ cột 2 – 51 là tƣơng ứng với 50 câu hỏi thi tƣơng ứng bảng đặc tả kiến thức của

từng câu theo phụ lục 4.

Trong tất cả các đề thử nghiệm câu n luôn tƣơng đƣơng nhau về mặt kiến thức, kĩ

năng.

CHƢƠNG 3

KẾT QUẢ NGHIÊN CỨU

3.1. Giới thiệu

Ứng dụng lý thuyết vào IRT vào xây dựng phân tích câu hỏi thi, đề thi là một

vấn đề không đơn giản. Những năm 70, dù cơ sở lý thuyết về IRT đã tƣơng đối

hoàn thiện nhƣng việc ứng dụng IRT vào IRT gặp khó khăn bởi các tính toán phức

tạp. Thời gian gần đây, cùng với việc phát triển của công nghệ thông tin, các phần

mềm chuyên dụng giúp cho việc ƣớc lƣợng tham số câu hỏi thi, định chuẩn đề thi,

so bằng đề thi, cũng nhƣ phân tích câu hỏi thi nhị phân, đa phân và đa chiều đồng

thời ƣớc lƣợng chính xác năng lực của thí sinh trở nên phổ biến hơn. Các phần mềm

về IRT có thể kể ra nhƣ BILOG, MULTILOG, WINSTEPS, IRTPRO, MPLUS,

QUEST, CONQUEST và HLM. Phần lớn chúng là các phần mềm thƣơng mại đắt

tiền và không dễ sử dụng. Dù vậy một số gói IRT đã đƣợc phát triển trong phần

mềm mã nguồn mở R để ƣớc tính các mô hình IRT khác nhau cũng xuất hiện và đã

đƣợc đón nhận nhƣ TAM. Bao gồm các gói ltm cho IRT không giới hạn

((Rizopoulos, 2006), eRm cho các mô hình Rasch mở rộng (Mair & Hatzinger,

2007), mlirt cho đánh giá đa cấp và Bayesian của một số mô hình IRT (Fox, 2007),

gpcm (Johnson, 2007) cho một dự toán Bayesian của mô hình tín dụng một phần

tổng quát, MCMCpack cho Bayesian

Trong luận văn này tác giả sử dụng phần mềm Conquest, đây là phần mềm

do nhóm tác giả Margaret L.Wu, Raymond J.Adams, Mar R.Wilson, Samuel

A.Haldane ở Australian Council for Educational Research phát triển. Đây là một

phần mềm rất mạnh với nhiều tính năng và hƣớng dẫn chi tiết cụ thể. Tuy nhiên bản

phần mềm tác giả nhận đƣợc dùng để phần tích là bản phần mềm sử dụng dòng lệnh

để viết lệnh điều khiển (command), không có giao diện trực quan để thao tác nhƣ đa

số các phần mềm thƣơng mại khác. Điều này cũng là một cản trở trong việc phổ cập

IRT vào cộng đồng. Bởi các khái niệm, các tham số trong IRT của IRT đã quá phức

tạp. Nên việc sử dụng Conquest phân tích các tham số đề thi mất khá nhiều thời

gian.

3.2. Phân tích tham số câu hỏi thi

Quá trình biên soạn câu hỏi thi, ta xây dựng đƣợc 4 đề thi thử nghiệm, cùng một hệ

thống các câu hỏi thi tƣơng đƣơng theo mô tả ở bảng 2.3 . Kết quả thử nghiệm đƣợc

lƣu vào các file excel rồi từ đó chuyển dữ liệu theo định dạng trong file chạy

(Ex1.cqc) để lƣu vào file Ex1.dat. Ta sử dựng dữ liệu thô đó để phân tích các câu

hỏi thử nghiệm và đề thi thử nghiệm bẳng phần mềm ConQuest.

Các file: Ex1.dat, Ex1.cqc,. ex1.lab

Phân tích đề thi 01. Với mẫu thu đƣợc các file: ex1.int, ex1.shw.

Đề Toán: Có 4 đề Toán, mỗi đề có 50 câu hỏi (CH) và một đề tự luận ngắn

gồm 25 câu hỏi với thành phần CH, bao gồm đƣợc soạn từ 7 chủ đề của môn toán

lớp 12 ( Ứng dụng đạo hàm, hàm số mũ và logarit, Nguyên hàm, tích phân và ứng

dụng, Số phức, Khối đa diện, Khối tròn xoay và Hình giải tích trong không gian)

theo tỷ lệ các câu hỏi, mức đó khó trong bảng ma trận đặc trƣng của đề thi. Vì vấn

đề chọn mẫu vào cuối năm học 2016 – 2017. Bộ giáo dục đã thay đổi hình thức thì

từ tự luận sang trắc nghiệm, nên quá trình lấy mẫu các câu hỏi tự luận đã không đạt

kết quả tốt. Do vậy mẫu tự luận phải loại bỏ (do học sinh không làm hết khả năng,

không nghiêm túc khi làm bài). Với các câu hỏi nhị phân (0-1) - dichotomous đã

lựa chọn ta cũng có thể tái tạo đƣợc dữ liệu đa phân – polytomous. Tuy nhiên việc

tái tạo này không cần thiết, vì mục đích của chúng ta ở đây là tập chung phân các

tham số của từng câu hỏi trong từng đề thi, để từ có đánh giá chất lƣợng thực tế của

câu hỏi trên mẫu đã triển khai (vì vậy mẫu lựa chọn không tốt, độ giá trị của câu hỏi

không có). Tiếp theo ta minh họa chi tiết cách phân tích các tham số đặc trƣng của

các câu hỏi trong đề 1 (các đề khác ta làm tƣơng tự).

Khi chạy chƣơng Conquest, nó sẽ sinh ra các file kết quả trong đó file *.int

để lấy số liệu phân tích câu hỏi theo CTT, ngƣợc lại file *. Shw dùng số liệu để

phân tích câu hỏi theo IRT.

3.2.1. Phân tích câu hỏi thi bằng CTT

Để phân tích một đề thi theo lý thuyết đánh giá cổ điển ta cần quan tâm đến

các tham số sau: Độ khó của câu hỏi thi, Các khả năng nhầm đáp án, Chất lƣợng

của các phƣơng án sai (mồi nhử), Độ phân biệt của câu hỏi thi, Hệ số tƣơng quan

giữa điểm của câu hỏi thi với điểm toàn bài, Độ tin cậy của đề thi

Nhƣ ta đã biết với các câu hỏi : 1, 2, 3, …, 50 ta cần thống kê lại các tham số

nhƣ bảng vẽ .

Bảng 3.1 Độ khó P của một câu hỏi trắc nghiệm số 1.

Phƣơng án trả lời A B C D* Bỏ sót Tổng

Số lƣợng 7 2 18 24 0 51

Độ khó P (%) 13.73 3.92 35.29 47.06

Ghi chú: * ký hiệu phƣơng án trả lời đúng.

item:1 (CAU_01)

Cases for this item 51 Discrimination 0.36

Item Threshold(s): -1.13 Weighted MNSQ 0.97

Item Delta(s): -1.13

------------------------------------------------------------------------------

Label Score Count % of tot Pt Bis t (p) PV1Avg:1 PV1 SD:1

------------------------------------------------------------------------------

A 0.00 7 13.73 -0.23 -1.69(.098) -1.49 0.21

B 0.00 2 3.92 0.12 0.81(.422) -1.10 0.18

C 0.00 18 35.29 -0.26 -1.88(.067) -1.35 0.34

D 1.00 24 47.06 0.36 2.74(.008) -1.12 0.41

===========================================================

Ta sẽ xem thông số của từng câu hỏi.

Với câu hỏi 1. Độ khó : p = 47,06%, Độ phân biệt D =0.36

Tƣơng tự với các câu hỏi khác ta cũng thống kê lại các tham số đặc trƣng của

câu hỏi để từ đó quyết định loại bỏ, chỉnh sửa hay cập nhật một câu hỏi nào đó vào

ngân hàng đề thi. Tuy nhiên việc định chuẩn, so bằng giữa các câu hỏi thi, các đề thi

thƣờng gặp khó khăn, vì không có cơ sở logic để so bằng giữa các đề tƣơng đƣơng.

3.2.2. Phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại

Việc phân tích câu hỏi thi bằng lý thuyết đánh giá hiện đại cũng có thể đƣa ra

những thông tin thống kê để phân tích câu hỏi thi bằng lý thuyết đánh giá cổ điển.

Tuy nhiên, việc phân tích câu hỏi thi bằng lý thuyết đánh giá hiện đại (sử dụng phần

mềm CONQUEST và các phần mềm chuyên dụng khác) còn có thể giúp có đƣợc

những thông tin dƣới đây:

a) Sự phù hợp của câu hỏi thi

Sự phù hợp của các câu hỏi thi thể hiện các câu hỏi thi cùng đo một đại

lƣợng có tên gọi là INFIT MNSQ, nằm trong khoảng 0.70 đến 1.30 theo [5]. Nếu

có một câu hỏi nào có INFIT MNSQ nằm ngoài khoảng trên cần bị loại bỏ. Xem ví

dụ minh hoạ:

------------------------------------------------------------------------------------------

VARIABLES UNWEIGHTED FIT WEIGHTED FIT

--------------- ----------------------- -----------------------

item ESTIMATE ERROR^ MNSQ CI T MNSQ CI T

------------------------------------------------------------------------------------------

1 CAU_01 -0.179 0.242 1.09 ( 0.61, 1.39) 0.5 1.09 ( 0.66, 1.34) 0.6

2 CAU_02 -2.053 0.297 1.01 ( 0.61, 1.39) 0.1 0.97 ( 0.03, 1.97) 0.1

3 CAU_03 -1.461 0.279 0.87 ( 0.61, 1.39) -0.6 0.93 ( 0.31, 1.69) -0.1

4 CAU_04 -2.045 0.297 0.35 ( 0.61, 1.39) -4.4 0.84 ( 0.04, 1.96) -0.2

5 CAU_05 0.789 0.229 0.95 ( 0.60, 1.40) -0.2 0.97 ( 0.78, 1.22) -0.3

6 CAU_06 -0.175 0.242 0.90 ( 0.61, 1.39) -0.5 0.97 ( 0.66, 1.34) -0.1

7 CAU_07 -0.425 0.248 1.03 ( 0.61, 1.39) 0.2 1.00 ( 0.61, 1.39) 0.0

8 CAU_08 1.699 0.231 1.32 ( 0.61, 1.39) 1.5 1.21 ( 0.78, 1.22) 1.8

9 CAU_09 0.268 0.234 1.35 ( 0.61, 1.39) 1.6 1.33 ( 0.73, 1.27) 2.2

10 CAU_10 0.470 0.231 0.98 ( 0.61, 1.39) -0.1 1.01 ( 0.75, 1.25) 0.1

11 CAU_11 1.612 0.233 1.50 ( 0.60, 1.40) 2.2 1.17 ( 0.78, 1.22) 1.4

12 CAU_12 -2.031 0.296 0.99 ( 0.61, 1.39) 0.0 1.01 ( 0.04, 1.96) 0.2

13 CAU_13 0.665 0.229 1.21 ( 0.61, 1.39) 1.0 1.16 ( 0.77, 1.23) 1.3

14 CAU_14 0.270 0.234 0.88 ( 0.61, 1.39) -0.5 0.92 ( 0.73, 1.27) -0.6

15 CAU_15 -2.027 0.296 0.94 ( 0.61, 1.39) -0.2 1.00 ( 0.05, 1.95) 0.2

Bảng 3.2 Bảng tham số các hỏi thi về mức độ phù hợp

16 CAU_16 -0.228 0.245 1.08 ( 0.60, 1.40) 0.4 0.94 ( 0.64, 1.36) -0.3

17 CAU_17 -1.225 0.272 0.46 ( 0.61, 1.39) -3.3 0.79 ( 0.39, 1.61) -0.7

18 CAU_18 -0.170 0.242 0.73 ( 0.61, 1.39) -1.4 0.80 ( 0.66, 1.34) -1.2

19 CAU_19 -0.556 0.252 0.79 ( 0.61, 1.39) -1.0 0.88 ( 0.58, 1.42) -0.5

20 CAU_20 0.948 0.227 1.14 ( 0.61, 1.39) 0.8 1.11 ( 0.79, 1.21) 1.0

21 CAU_21 1.916 0.237 1.56 ( 0.60, 1.40) 2.4 1.30 ( 0.74, 1.26) 2.1

22 CAU_22 -0.702 0.256 0.91 ( 0.61, 1.39) -0.4 0.95 ( 0.55, 1.45) -0.2

23 CAU_23 0.373 0.232 0.90 ( 0.61, 1.39) -0.4 0.93 ( 0.74, 1.26) -0.5

24 CAU_24 0.570 0.230 1.07 ( 0.61, 1.39) 0.4 1.09 ( 0.76, 1.24) 0.8

25 CAU_25 -0.843 0.261 0.43 ( 0.60, 1.40) -3.5 0.67 ( 0.51, 1.49) -1.4

26 CAU_26 -0.860 0.261 1.07 ( 0.61, 1.39) 0.4 0.89 ( 0.51, 1.49) -0.4

27 CAU_27 1.717 0.237 1.18 ( 0.59, 1.41) 0.9 1.03 ( 0.76, 1.24) 0.3

28 CAU_28 1.226 0.227 0.92 ( 0.61, 1.39) -0.4 0.94 ( 0.80, 1.20) -0.6

29 CAU_29 -2.474 0.308 0.61 ( 0.61, 1.39) -2.2 0.98 ( 0.00, 2.22) 0.2

30 CAU_30 -3.216 0.322 0.51 ( 0.61, 1.39) -3.0 0.98 ( 0.00, 2.83) 0.3

31 CAU_31 -2.503 0.309 0.38 ( 0.61, 1.39) -4.1 0.92 ( 0.00, 2.24) 0.1

32 CAU_32 -0.568 0.252 0.83 ( 0.61, 1.39) -0.9 0.88 ( 0.58, 1.42) -0.5

33 CAU_33 0.262 0.234 0.99 ( 0.61, 1.39) 0.0 1.03 ( 0.73, 1.27) 0.2

34 CAU_34 0.522 0.233 1.03 ( 0.60, 1.40) 0.2 1.01 ( 0.75, 1.25) 0.1

35 CAU_35 0.752 0.228 0.82 ( 0.61, 1.39) -0.9 0.85 ( 0.78, 1.22) -1.3

36 CAU_36 2.239 0.244 1.14 ( 0.60, 1.40) 0.7 1.08 ( 0.68, 1.32) 0.5

37 CAU_37 -0.064 0.240 1.37 ( 0.61, 1.39) 1.7 1.10 ( 0.68, 1.32) 0.7

38 CAU_38 1.634 0.235 1.03 ( 0.59, 1.41) 0.2 1.00 ( 0.77, 1.23) 0.0

39 CAU_39 2.727 0.260 1.86 ( 0.59, 1.41) 3.4 1.18 ( 0.54, 1.46) 0.8

40 CAU_40 -0.304 0.245 0.72 ( 0.61, 1.39) -1.5 0.80 ( 0.63, 1.37) -1.1

41 CAU_41 0.363 0.232 0.77 ( 0.61, 1.39) -1.2 0.82 ( 0.74, 1.26) -1.4

42 CAU_42 1.092 0.235 1.39 ( 0.58, 1.42) 1.7 1.27 ( 0.79, 1.21) 2.3

43 CAU_43 -2.064 0.297 0.47 ( 0.61, 1.39) -3.3 0.89 ( 0.03, 1.97) -0.1

44 CAU_44 -2.063 0.297 0.66 ( 0.61, 1.39) -1.8 0.97 ( 0.03, 1.97) 0.1

45 CAU_45 -0.433 0.249 0.71 ( 0.61, 1.39) -1.5 0.87 ( 0.61, 1.39) -0.6

46 CAU_46 -0.432 0.249 0.78 ( 0.61, 1.39) -1.1 0.79 ( 0.61, 1.39) -1.1

47 CAU_47 0.364 0.232 0.95 ( 0.61, 1.39) -0.2 0.97 ( 0.74, 1.26) -0.2

48 CAU_48 2.986 0.265 0.92 ( 0.60, 1.40) -0.3 0.95 ( 0.47, 1.53) -0.1

49 CAU_49 1.908 0.237 1.23 ( 0.60, 1.40) 1.1 1.10 ( 0.74, 1.26) 0.8

50 CAU_50 1.728* 1.781 1.26 ( 0.58, 1.42) 1.2 1.10 ( 0.76, 1.24) 0.8

Dựa vào bảng số liệu trong file ex1.shw mà ta thấy các câu hỏi 4, 11, 17, 21,

30, 39 là những câu cần phải loại bỏ vì nó nằm ngoài vùng năng lực của thí sinh (có

thể nó quá dễ hoặc quá khó với thí sinh). Hay nói một cách khác câu hỏi thi không

tìm đƣợc mô hình, hàm đặc trƣng. Quá trình ƣớc lƣợng tham số của câu hỏi không

thành công.

Chúng ta xem xét các hàm đặc trƣng của các câu hỏi để thấy đƣợc việc ƣớc

lƣợng tham số (độ khó) cho các câu hỏi thƣờng khó khăn, trong nhiều trƣờng hợp là

không ƣớc lƣợng đƣợc bởi sai số giữa hàm đặc câu hỏi trƣng quan sát, và đặc trƣng

câu hỏi tính toán là quá lớn. Chúng ta xem xét một số câu dự định loại bỏ ở trên.

Câu số 4.

Hình 3.1 Đồ thị hàm đặc trưng câu hỏi số 4.

Câu số 21.

Hình 3.2 Đồ thị hàm đặc trưng câu hỏi số 21.

Câu 39.

Hình 3.3 Đồ thị hàm đặc trưng câu hỏi số 39.

Các câu 4, 21, 39 ở trên đều là những câu rất khó ƣớc lƣợng đƣợc tham số câu hỏi, bởi các đáp ứng của TS với CH là rời rạc và khó hội tụ. Do vậy hàm đặc trƣng câu hỏi không tính đƣợc các tham số của câu hỏi (quá trình ƣớc lƣợng không hội tụ). Nhìn trên các hình vẽ chúng ta thấy đƣờng chấm xanh không bám sát vào các đƣờng liền xanh.

Trong khi đó đƣờng cong quan sát của câu hỏi và đƣờng cong tính toán của

câu hỏi 40 là có xu hƣớng hội tụ.

Hình 3.4 Đồ thị hàm đặc trưng câu hỏi số 40.

b) Sơ đồ phân bố độ khó câu hỏi thi và năng lực thí sinh

Hình 3.5 Bản đồ phân bố độ khó câu hỏi thi và năng lực thí sinh

Bản đồ phân bố độ khó câu hỏi thi và năng lực thí sinh cho thấy mức độ phù

hợp của đề thí đối với thí sinh dự thi. Có thể là đề thi quá dễ, quá khó hoặc rất phù

hợp. Bản đồ phân bố cho thấy đề thi đo đƣợc hầu hết năng lực của thí sinh hay còn

có những khoảng trống cần bổ sung một số câu hỏi để đo và phân biệt đƣợc năng

lực của các thí sinh ở đó. Ở hình minh họa 2.6 đề thi này là dễ so với năng lực của

thí sinh. Các câu hỏi ở mức độ trung bình còn ít, cần bổ xung. Các câu hỏi 12, 15, 2,

4, 43, 44, 29, 30, 31 là rất dễ so với năng lực của tập thí sinh đang kiểm tra. Vì vậy

ta phải soạn lại các câu hỏi này nhằm tăng độ khó của câu hỏi. Chúng ta hoàn toàn

có thể lấy các câu hỏi 12, 15, 2, 4, 43, 44, 29, 30, 31 từ các đề tƣơng đƣơng 02, 03,

04 rồi tính toán lại các tham số đặc trƣng (đƣờng cong đặc trƣng) của đề thi và hàm

thông tin của đề thi.

c) Đƣờng cong đặc trƣng của đề thi

Dựa vào kết quả chạy của phần mềm Conquest ta dễ dàng có tham số đặc

trƣng (độ khó b) của từng câu hỏi. ví dụ từ bảng 2.8 câu hỏi 1 có độ khó b = -0.18

nên hàm đặc trƣng của câu hỏi 40 có dạng và đồ thị của

nó là hình 2.5. Một cách khác để xác định độ khó của câu hỏi (Item) là dựa vào

đƣờng cong đặc trƣng câu hỏi. Nếu thì độ khó câu hỏi .

Để giúp ích cho việc so bằng điểm cũng nhƣ chuẩn hóa đề thi, việc tính toán

đƣờng cong đặc trƣng cho cả đề thi là hết sức cần thiết. Thực ra việc tính toán

đƣờng cong đặc trƣng cho đề thi là việc cộng gộp tất cả các đƣờng cong đặc trƣng

của từng câu hỏi thi. Dựa vào đƣờng cong đặc trƣng của đề thi, ứng với thi sinh có

năng lực là thì ta hoàn toàn có thể ƣớc lƣợng đƣợc điểm của thí sinh đó. Đồng

thời dựa vào hàm đặc trƣng của đề thi chúng ta sẽ biết đề thi nào khó hoặc dễ hơn

với các nhóm học sinh có năng lực khác nhau.

Hình 3.6 Đường cong đặc trưng của đề thi số 1.

Nhận xét: dựa vào đƣờng cong đặc trƣng của từng câu hỏi thi chúng ta dễ

dàng tính đƣợc độ khó, độ phân biệt của các câu hỏi thi, đề thi theo lý thuyết IRT.

d) Hàm thông tin của đề thi.

Hàm thông tin của đề đƣợc tính bằng tổng các hàm thông tin của câu hỏi thi.

Dựa vào thông tin của đề thi ta hoàn toàn tính đƣợc sai số tiêu chuẩn của đề thi bới

công thức: .

Lord [3] đã đề xuất một quy trình sử dụng các hàm thông tin để thiết kế các

ĐTN đáp ứng bất kì yêu cầu mong muốn nào của đặc trƣng ĐTN. Quy trình này

dựa trên có sẵn một ngân hàng ĐTN và các câu hỏi đã đƣợc ƣớc lƣợng tham số theo

IRT.

Các bƣớc quy trình đƣợc đề nghị nhƣ sau:

(1) Quyết định về hình dáng muốn có của hàm thông tin. Lord gọi đó là hàm

thông tin mục tiêu.

(2) Chọn các CH từ ngân hàng đề có hàm thông tin CH sẽ phủ kín các vùng

năng lực của hàm thông tin mục tiêu.

(3) Sau mỗi CH đƣợc đƣa vào ĐTN, tính hàm thông tin của ĐTN bào gồm

các CH đã lựa chọn.

(4) Tiếp tục thay thế và lựa chọn các CH để đƣa vào ĐTN cho đến khi hàm

thông tin của ĐTN tiệm cận với hàm thông tin mục tiêu ở mức độ chấp nhận đƣợc.

Hình 3.7 Hàm thông tin của đề thi số 1.

Hình 3.8 Hàm thông tin của đề thi số 2.

Hình 3.9 Hàm thông tin của đề thi số 3.

Hình 3.10 Hàm thông tin của đề thi số 4.

Việc so sánh hai hàm thông tin đƣợc thực hiện bằng cách tính hiệu suất tỷ

đối của một ĐTN so với một ĐTN khác [3]. . Trong đó là

hiệu suất tỷ đối và , là các hàm thông tin tƣơng ứng của ĐTN A và B.

3.2.3. Phân tích câu hỏi thi đa chiều

Theo [3], các TS sử dụng nhiều năng lực tri thức để ứng đáp trắc nghiệm,

nhƣng có một số năng lực liên quan đến nhiệm vụ trắc nghiệm, một số không. Số

chiều năng lực cần cho mô hình phân tích dữ liệu phụ thuộc vào số chiều và mức độ

năng lực (nhận thức) của TS. Với tập dữ liệu đã lấy mẫu ta xác định rõ các chiều

năng lực (khả năng của thí sinh khi làm các vấn đề - chiều hƣớng năng lực của TS)

của TS thông qua việc ứng đáp các phần của toán 12: Giải tích (Ứng dựng đạo hàm,

nguyên hàm tích phân), Đại số (Hàm số mũ, logarti và số phức) và Hình học (khối

đa diện, khối tròn xoay và hình giải tích trong không gian).

Ta dựa vào file chạy của ƣớc lƣợng tham số của câu hỏi khi nó là các câu hỏi

đa chiều, coi các chiều năng lực toán học của mỗi TS lớp 12 là: Giải tích, Đại số và

Hình học. Đây là mỗi chiều năng lực của từng TS. Qua phân tích này chúng ta sẽ rút

ra các đánh giá tƣơng tác về các năng lực (Giải tích, Đại số, Hình học) của TS về đề

thi thông qua bảng 3.3

Nhìn chung đề kiểm tra đã cho dễ so với mức năng lực, một số câu dễ quá

cần phải sửa, thay thế cho phù hợp chung với đề. Trong ba chiều năng lực (Giải

tích, đại số, hình học) thì năng lực đại số của TS là tốt nhất, năng lực hình học của

TS là thấp nhất. Nhƣng 3 chiều năng lực này không quá chênh lệch nhau. Về cơ bản

đề thi ra đạt yêu cầu các phần kiến thức toán học (giải tích, đại số, hình học) trong

đề thi không quá khác biết về mức độ khó dễ. Cụ thể ta xét các chiều năng lực riêng

rẽ sau:

Bảng 3.3 Phân tích đa chiều năng lực của TS với đề thi 01. Dimension Terms in the Model (excl Step terms) --------------------------------------- Giaitich Daiso Hinhhoc +item -------------------------------------------------------------------------------------- 4 | | | | | | | | | | | | | X| | | | | | | | | | | | XXX| | | 3 | XX| | | | XXX| | | X| XXXX| |21 | | XXXX| | | X| XXXXXX| |48 | XX| XXXXXXXX| | | XXX| XXXXX| |39 | 2 XXXXX|XXXXXXXXXXXX| | | XXXX| XXXXXXXX| X| | XXXXXXXXXX| XXXXX| XX|8 20 27 | XXXXXXX| XXXXXXX| |11 36 | XXXXXX| XXXXXXX| XXXXX|13 | XXXXXXXXXXXX| XXXX| XXXXX|28 34 49 | XXXXXXXXXX| XXX| XXXXXX|50 | 1 XXXXXX| XX| XXXXXX|14 33 38 | XXX| XXX| XXXXXXXX|5 | XXXXX| XX| XXXXXXXXX| | XXXXXX| XX| XXXXXXXX|10 18 24 | X| XXXXXXXXXXXXXXX|16 23 42 | XXXX| XX| XXXXXXX|9 | XXX| XX| XXX|19 32 35 | 0 XXX| XXXX| XXXX| | XX| XX| XXXX|1 6 | XX| X| XXX|7 41 47 | XX| X| XXX| | XXX| | XX|17 22 | X| | X|25 37 | -1 X| | XX|26 40 | | | XXX|45 46 | | | XXX| | | | X|12 | | | XXX|3 15 | | | | | | | X|31 | -2 | | |29 | | | |2 4 | | | | | | | | | | | |30 | | | |43 44 | -3 | | | | ====================================================================================== Each 'X' represents 0.5 cases .

Dimension Terms in the Model (excl Step terms) ------------- Giaitich +item ------------------------------------------------------------ 3 | | | | X| | | | X| | XX| | XXX| | 2 XXXXX| | XXXX| | XXXXXXXXXX|8 27 | XXXXXXX|11 | XXXXXX| | XXXXXXXXXXXX|28 | XXXXXXXXXX| | 1 XXXXXX| | XXX|5 | XXXXX| | XXXXXX|10 24 | X|23 | XXXX|9 | XXX| | 0 XXX| | XX|1 6 | XX|7 | XX| | XXX|22 | X|25 | -1 X|26 | | | | | | | |3 | | | | | -2 | | |2 4 | | | | | | | | | | | -3 | | | | ============================================================ Each 'X' represents 0.5 cases ============================================================

1. Năng lực Giải tích.

Hình 3. 11. Năng lực giải tích của TS

Mức độ câu hỏi dƣới mức năng lực của thí sinh, đặc biệt các 2,3,4 là quá dễ.

Thiếu các câu có độ khó trung bình.

Dimension Terms in the Model (excl Step terms) ------------- Daiso +item ------------------------------------------------------------ 4 | | | | | | X| | | | | | XXX| | 3 XX| | XXX| | XXXX|21 | XXXX| | XXXXXX| | XXXXXXXX| | XXXXX| | 2 XXXXXXXXXXXX| | XXXXXXXX| | XXXXX|20 | XXXXXXX| | XXXXXXX|13 | XXXX|34 | XXX| | 1 XX|14 33 | XXX| | XX| | XX|18 | XX|16 | XX| | XX|19 32 | 0 XXXX| | XX| | X| | X| | |17 | | | -1 | | | | | | |12 | |15 | | | |31 | -2 |29 | | | | | | | |30 | | | | | -3 | | | | ============================================================ Each 'X' represents 0.5 cases ============================================================

2. Năng lực đại số

Hình 3. 12. Năng lực đại số của TS

Mức độ câu hỏi dƣới mức năng lực của thí sinh, đặc biệt các 12,15,17 là quá dễ. So với năng lực ứng đáp các câu hỏi phần giải tích, năng lực ứng đáp câu hỏi phần đại số của mẫu TS tốt hơn. Thiếu các câu có độ khó cao để phân loại tốt thí sinh.

Dimension Terms in the Model (excl Step terms) ------------- Hinhhoc +item ------------------------------------------------------------ 3 | | | | | | | | |48 | | | |39 | 2 | | X| | XX| | |36 | XXXXX| | XXXXX|49 | XXXXXX|50 | 1 XXXXXX|38 | XXXXXXXX| | XXXXXXXXX| | XXXXXXXX| | XXXXXXXXXXXXX|42 | XXXXXXX| | XXX|35 | 0 XXXX| | XXXX| | XXX|41 47 | XXX| | XX| | X|37 | -1 XX|40 | XXX|45 46 | XXX| | X| | XXX| | | | X| | -2 | | | | | | | | | | |43 44 | | | -3 | | | | ============================================================ Each 'X' represents 0.5 cases

3. Năng lực hình học

Hình 3. 13. Năng lực hình học của TS

Đề thi phù hợp với năng lực của thí sinh. Nhƣng cần chỉnh sữa câu 43 hoặc 44 để tăng độ khó của câu hỏi.

3.2.4. Phân tích câu hỏi thi đa phân

Việc phân tích các các câu hỏi (TN) nhiều lựa chọn ngoài hai trạng thái 0 -1

(đúng sai), ta hoàn toàn có thể phân tích các câu hỏi tự luận nhiều trang thái (mức

điểm (0-1-2-3),… Giải sử với mỗi ý trong câu TL làm đúng thí sinh đƣợc 1 điểm.

Với mỗi câu TL có 3 ý nhỏ. Thì mức điểm phân bố cho một thí sinh bất kì luôn là 0

– 1 – 2 – 3. Có hàng loạt mô hình đƣợc đề xuất để phân tích câu hỏi đa phân,

nhƣng tổng quát nhất có lẽ là mô hình định giá từng phần (Partial Credit Model –

PCM) của Master, G.N. Có thể nói mô hình đa phân là trƣờng hợp tổng quát của

mô hình nhị phân hay các mô hình nhị phân chúng ta vừa phân tích ở trên là một

trƣờng hợp riêng của mô hình đa phân. Đây là một mô hình rất hay để phân tích các

câu hỏi thi theo hình thức tự luận. Từ đó có thể thiết kết một đề thi gồm cả các câu

hỏi TL lẫn TN nhằm phát huy hết ƣu điểm của từng loại câu hỏi thi. Tuy nhiên do

việc thay đổi hình thức thi THPT QG năm vừa qua (2017) dẫn đến việc thu thập số

liệu về các câu hỏi thi tự luận đã không thành công. (Học sinh không làm bài một

cách nghiêm túc). Đó là một điều hết sức đáng tiếc. Việc này mặc dù không ảnh đến

quá trình nghiên cứu của luận văn, nhƣng việc thiếu số liệu minh họa các câu hỏi đa

phân chất lƣợng dẫn đến các khuyến nghị ƣu nhƣợc điểm giữa hai hình thức thi phổ

biến hiện nay là TNKQ và TL và cách kết hợp giữa hai hình thức thi này để kết hợp

các ƣu điểm giữa hai loại hình thi này vẫn chỉ mang tính lý thuyết mặc dù cơ sở lý

thuyết đã đƣợc phân tích kĩ càng. Tác giả hy vọng rằng trong thời gian tới sẽ có

những nghiên cứu với các số liệu tin cậy để đánh giá về mô hình câu hỏi đa phân.

3.3. Một số kết quả phân tích câu hỏi thi.

3.3.1. Quy trình hiệu chuẩn đề kiểm tra

Các thủ tục đƣợc sử dụng để hiệu chuẩn một bài kiểm tra đã đƣợc đề xuất

bởi Birnbaum vào năm 1968 và đã đƣợc thực hiện trong các chƣơng trình máy tính

đƣợc sử dụng rộng rãi nhƣ BICAL (Wright và Mead, 1976) và LOGIST

(Wingersky, Barton và Chúa, 1982). Mô hình Birnbaum là một thủ tục lặp đi lặp lại

sử dụng hai giai đoạn đánh giá khả năng tối đa. Trong một giai đoạn, các tham số

của N câu hỏi trong đề thử nghiệm đƣợc ƣớc tính, và trong giai đoạn thứ hai, các

tham số năng lực của thử nghiệm M ngƣời đƣợc ƣớc tính. Hai giai đoạn đƣợc thực

hiện lặp đi lặp lại cho đến khi tập hợp các tham số thu đƣợc ƣớc tính ổn định. Tại

thời điểm này, bài kiểm tra đã đƣợc hiệu chuẩn và chỉ số về khả năng đƣợc xác

định. Trong giai đoạn đầu tiên của mô hình Birnbaum, ƣợc lƣợng năng lực của mỗi

thí sinh là đƣợc đối xử thể hiện bằng số liệu thật của đặc tính tiềm ẩn. Sau đó, các

thông số của mỗi câu hỏi trong bài kiểm tra đƣợc ƣớc lƣợng thông qua thủ tục xác

suất tối đa. Việc này đƣợc thực hiện cho từng câu hỏi tại một thời gian, bởi vì một

giả thiết cơ bản là các câu hỏi này độc lập với nhau. Kết quả là thu đƣợc một bộ các

giá trị cho các ƣớc lƣợng của các tham số của câu hỏi trong bài kiểm tra.

Giai đoạn thứ hai giả định rằng các ƣớc lƣợng tham số câu hỏi sản sinh ra

trong giai đoạn đầu tiên là thực sự là giá trị của các tham số các câu hỏi (quá trình

ƣớc lƣợng tham số câu hỏi là chuẩn xác). Sau đó, khả năng của mỗi ngƣời thí sinh

đƣợc ƣớc tính bằng thuật toán thủ tục tối đa. Giả định rằng khả năng của từng thí

sinh là độc lập với tất cả các thí sinh khác. Do đó tại một thời điểm, năng lực của thí

sinh luôn đƣợc ƣớc lƣợng. Quá trình giai đoạn hai đƣợc lặp lại cho đến khi một số

tiêu chí hội tụ phù hợp đƣợc đáp ứng. Hiệu quả tổng thể là các tham số của N câu

hỏi đƣợc thử nghiệm với các mức độ năng lực khác nhau của M ngƣời thử nghiệm

đƣợc thực hiện cùng một lúc. Với quá trình này, nhằm giảm các tính toán quá phức

tạp của nó ngƣời ta thƣờng sử dụng các phần mêm chuyên dụng, đặc thù (free hoặc

thƣơng mại) để ƣớc lƣợng bộ tham số câu hỏi cho đề thi đƣợc chuẩn hóa. Cũng bởi

điều này mà lý thuyết IRT ở Việt Nam chƣa thực sự đƣợc ứng dụng. Bởi các khó

khăn về mặt tính toán cũng nhƣ sử dụng các phần mềm chuyên dụng.

3.3.2 . Các đặc trưng về các đề thử nghiệm

Mặc dù là các đề đƣợc làm độc lập nhau, nhƣng trong quá trình phân tích ta

thấy mức độ đáp ứng của đề thi với các mẫu thí TS là tƣơng đối giống nhau đều

trong khoảng năng lực từ -3 đến 3 là chủ yếu.

Đề 1 +item --------------------------------------------------------------------------------- | | 3 |48 | XXXX| | |39 | XX| | XX| | XXXXXXXXX| | XX| | XXXXXXXXXXXXXXX|36 | XXXXX| | 2 XXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXX|21 49 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|8 27 50 | XXXXXXXXX|11 38 | XXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|28 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|42 | 1 XXXXXXXXXXXXXXXXXX|20 | XXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX|5 35 | XXXXXXXXXXXXXXXX|13 24 | XXXXXXXXXXXXX|10 34 | XXXXXXXXXXX|23 41 47 | XXXXXXXXXXXXX|9 14 33 | XXXXX| | 0 XXXXXXX| | XXXXXXXXXXXXXXX|37 | XXXXX|1 6 18 | XXXXX|16 40 | XXXXXXXXXXX|7 45 46 | XXXXXXXXXXXXX|19 | XX|32 | XXXXX|22 | XXXX|25 26 | -1 XXXXX| | | | |17 | | | XX|3 | | | | | | | | | -2 |12 15 | |2 4 43 44 | | | |29 30 31 | ================================================================================= Each 'X' represents 0.1 cases

Hình 3. 14. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 01

Đề 2. +item --------------------------------------------------------------------------------------- 6 | | | | | | | | | | XXXXXX| | 5 XXX| | | | XXX| | | | XXXXXX| | 4 | | | | XXXXXXXXXXXX| | XXXXXXXXX|50 | XXXXXXXXX| | XXXXXXXXX| | 3 XXX|16 | XXX|21 | XXX| | XXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX| | 2 XXXXXXXXX|39 | XXXXXXXXX|8 25 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|41 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|32 44 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|9 11 | XXXXXXXXXXXXXXXXXXXXXX|35 40 | 1 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|34 48 | XXXXXXXXXXXXXXXXXX|3 14 42 47 | XXXXXXXXXXXX|28 37 | XXXXXXXXXXXX| | 0 XXXXXXXXX|2 33 38 | XXXXXXXXX|1 | XXXXXXXXX|12 19 | XXXXXX|10 24 | XXXXXX|5 46 | -1 XXXXXX|26 49 | |6 7 18 23 27 36 | XXX| | | | |13 45 | | | -2 | | | | |4 20 22 29 43 | | | | | -3 | | ======================================================================================= Each 'X' represents 0.1 cases

Hình 3. 15. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 02

Đề 3 +item --------------------------------------------------------------------------------------- 4 | | XXXXXXXX| | | | |9 | | | | | | | XXXXX| | 3 | | | | |14 | | | XXX| | XXX| | XXXXXXXX|39 | XXXXXXXX| | 2 |42 | XXXXX| | XXXXXXXXXXXXX| | XXXXXXXXXXXXX|32 | XXXXXXXXXXXXXXXX|28 | XXXXXXXXXXXXXXXXXXXXX|10 25 | XXXXXXXXXXXXXXXXXXXXX|16 34 50 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX|21 | 1 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|8 | XXXXXXXXXXXXXXXXXXXXXXXX|38 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|17 26 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|11 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|46 48 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|24 35 36 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|7 27 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX|15 | 0 XXXXXXXXXXXXXXXXXXX|1 2 49 | XXXXXXXXXXXXXXXXXXXXXXXXXXX|18 41 | XXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXX|20 40 44 | XXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXX|22 | XXXXX|13 | XXXXXXXXXXXXX|5 47 | -1 XXXXXXXX|4 | XXXXX|30 | XXXXX|6 37 45 | | | | | |3 19 | | | | | -2 | | | | |23 29 43 | | | | | |12 | |31 33 | | | -3 | | ======================================================================================= Each 'X' represents 0.1 cases

Hình 3. 16. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 03

Đề 4. +item --------------------------------------------------------------------------------------- | | 3 | | |30 37 43 45 46 | XXXXXXXXXXX|3 4 12 15 16 29 48 | | | | | | | 2 | | | | | | | | |47 | |9 24 | 1 | | | | | | |5 23 | |11 | |14 19 38 | 0 |17 25 39 | |2 21 | |20 | |7 | XX|26 28 34 42 49 | XXXX|31 33 | -1 XXXXXXX|18 50 | XXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|27 36 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXX|10 32 | XXXXXXXXXXXXXXXXXX|8 | -2 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|40 | XXXXXXXXXXXXXXXXXXXXXXXX|6 | XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX| | XXXXXXXXXXXXXXXXXX| | XXXXXXX|41 | XXXXXXXXXXX|22 | -3 XXXX| | XXXXXXX|1 | XX| | | | | | XXXX| | -4 |44 | | | | | |13 | | | | | -5 | | ======================================================================================= Each 'X' represents 0.1 cases =======================================================================================

Hình 3. 17. Biểu đồ tương quan giữa năng lực của thí sinh và độ khó của đề thi 04

Ta có thể ngay các đề thi gần nhƣ tƣơng đồng nhau, các đề thi này đều dễ so với năng lực của thí sinh. Do vậy công tác hiệu chỉnh các câu hỏi thi sẽ dễ dàng.

KẾT LUẬN, GỢI Ý GIẢI PHÁP VÀ KHUYẾN NGHỊ

1. Kết luận

Việc xây dựng một đề thi theo lý thuyết đo lƣờng hiện đại (IRT) hiện không

còn quá mới mẻ trên thế giới. Tuy nhiên ở Việt Nam có khá ít các nhóm nghiên cứu

sâu về lĩnh vực này. Các tài liệu tiếng Việt về lý thuyết đo lƣờng hiện đại chủ yếu

do tác giả Lâm Quang Thiệp viết và xuất bản, các tài liệu tiếng Anh hiện nay chủ

yếu là các Workshop (hội thảo) hoặc các sách hàn lâm của các tác giả Lord,

Baunman, Rash,…. Do vậy việc xây dựng, phân tích một đề thi theo lý thuyết IRT

của tác giả gặp khá nhiều khó khăn. Mặc dù vậy luận văn này đã giới thiệu, hệ

thống một cách sơ lƣợc quy trình xây dựng, phân tích và đánh giá một đề thi theo lý

thuyết IRT. Các bƣớc thực hiện xây dựng và phân tích, chuẩn hóa một đề thi. Từ đó

biết cách chọn lọc, nhận định chất lƣợng các câu hỏi thi cũng nhƣ mức độ khó dễ

của một đề thi nào đó nhằm nâng cao chất lƣợng đề thi. Thông qua việc xây dựng

và phân tích đề thi môn toán lớp 12 bằng lý thuyết đánh giá hiện đại, chúng ta thấy

các ƣu điểm của IRT. Đó là việc phân tích các tham số của câu hỏi thi không phụ

thuộc với các mẫu đƣợc chọn, các câu hỏi thi trong một đề cũng độc lập với nhau và

đƣợc ƣớc lƣợng các tham số (độ khó, độ phân biệt) một cách chủ động. Việc phân

tích đề thi vơi các câu hỏi nhị phân, đa phân và đa chiều giúp chất lƣợng đề thi đƣợc

nâng cao, công bằng, khách quan trong đánh giá và đặc biệt nhận biết đƣợc chất

lƣợng giáo dục tổng thể qua các năm đi lên hay đi xuống để từ đó giúp nhà quản lý

các quyết định, điều chỉnh chính sách hợp lý.

Qua đây, ta có thể áp dụng quy trình xây dựng, phân tích đề thi vào các đơn

vị trƣờng học riêng biệt hoặc các cụm trƣờng. Từ đó cải tiến, nâng dần chất lƣợng

kiểm tra đánh giá ở các cơ sở đào tạo giáo dục, giúp các kì kiểm tra đánh giá định kì

nghiêm túc, khách quan, phản ánh đúng chất lƣợng giáo dục. Đặc biệt trong giai

đoạn hiện nay việc tổ chức các kì thi quốc gia đã chuyển dần sang hình thức TN.

Việc nhìn nhận các chiều năng lực riêng biệt của TS cũng là một vấn đề hết sức mới

mẻ. Qua việc phân tích các mối tƣơng quan giữa các chiều năng lực (Giải tích, Đại

số, Hình học) của TS giúp cho ta có cái nhìn rõ ràng về các năng lực của các nhóm

TS cụ thể. Từ đó bài kiểm tra có tính chất phân hóa, phân loại TS tốt hơn.

100

2. Một số gợi ý giải pháp và khuyến nghị

Do năng lực và thời gian có hạn, luận văn chƣa phân tích chi tiết cơ sở lý

thuyết của IRT cũng nhƣ các ứng dụng cụ thể của nó. Đặc biệt là hai quá trình ƣớc

lƣợng tham số câu hỏi thi và quá trình định chuẩn đề thi. Tác giả cũng mong rằng

trong thời gian tới có nhiều đề tài về lĩnh vực này cũng nhƣ có nhiều chuyên gia

trong nƣớc, cũng nhƣ các chuyên gia ngƣời Việt ở nƣớc ngoài tham gia viết các

cuốn sách tham khảo một cách cụ thể, cặn kẽ để IRT đƣợc phổ biến trong cộng

đồng giáo viên, cũng nhƣ có một cộng đồng riêng nghiên cứu sâu về lý thuyết này.

Một trong những khó khăn khi tác giả thực hiện đề tài này lựa chọn các phần

mềm chuyên dụng trong phân tích các câu hỏi thi. Bởi ở hiện nay trên thế giới có

hai xu hƣớng (trƣờng phái) nghiên cứu về IRT. Đó là các trung tâm nghiên cứu ở

Hoa Kỳ - đông đảo nhất và nhóm nghiên cứu của Úc cùng các nƣớc Châu Á Thái

Bình Dƣơng. Các nhóm nghiên cứu ở Hoa Kỳ có cộng đồng rất đông và có nhiều tài

liệu và phần mềm thƣơng mại dùng cho IRT phổ biến trên Internet. Nhóm thứ hai là

ở Úc, có cộng đồng rất nhỏ bé và quen thuộc với chúng ta hơn với bản phần mềm

ConQuest đã đƣợc phổ cập ở Việt Nam. Tuy nhiên tài liệu về Conquest rất ít và khó

dùng. Conquest đã đƣợc nhúng vào các tool về thống kê mã nguồn mở trong R,

TAM. Nên tác giả rất mong có một phần mềm chuyên về phân tích IRT bằng tiếng

Việt để giúp cho việc phân tích đánh giá câu hỏi thi, đề thi trực quan và dễ dàng

hơn.

Việc phân tích các ƣu nhƣợc điểm của hai hình thức thi TN và TL vẫn chƣa

đƣợc phân tích bằng các số liệu cụ thể là một điều đáng tiếc. Tác giả cũng hy vọng

trong thời gian tới các đề tài nhƣ trên sẽ tiếp tục đƣợc nghiên cứu, thực hiện bởi các

đề tài khác để cộng đồng nghiên cứu và làm việc với IRT ngày càng đông lên, nắm

bắt tốt hơn về nền tảng lý thuyết cũng nhƣ ứng dụng của lý thuyết đo lƣờng hiện

đại. Để việc áp dụng lý thuyết IRT vào quá trình phân tích, xây dựng, đánh giá đề

thi đƣợc phổ biến và thƣờng xuyên.

101

TÀI LIỆU THAM KHẢO

1. Lâm Quang Thiệp (2008), Trắc nghiệm và ứng dụng. Nhà xuất bản KHKT.

2. Lâm Quang Thiệp (2012), Đo lường và đánh giá hoạt động học tập trong nhà

trường. Nhà xuất bản sƣ phạm.

3. Lâm Quang Thiệp (2011), Đo lường trong giáo dục – Lý thuyết và ứng dụng.

Nhà xuất bản ĐH QGHN.

4. Dƣơng Thiệu Tống (1995), Trắc nghiệm và đo lường thành quả học tập. Nhà

xuất bản TP HCM.

5. Dƣơng Thiệu Tống (1995), Thống kê ứng dụng trong nghiên cứu khoa học giáo

dục. Nhà xuất bản khoa học xã hội.

6. Phạm Xuân Thanh (2013), Tập bài giảng đo lường. Ebook.

7. Trần Khánh Đức (2013), Tập bài giảng đo lường và đánh giá trong giáo dục.

Ebook.

8. Bộ giáo dục (2014), Sách giáo khoa toán THPT. Nhà xuất bản giáo dục.

9. Bộ giáo dục (2010), Chuẩn kiến thức kĩ năng toán THPT. Nhà xuất bản giáo dục.

10. Frank_B._Baker (2001), Item Response Theory. Published by the ERIC

11. Ronald_K._Hambleton (2012), Fundamentals of Item Response. Springer

12. Christine DeMars (2011), Item Response Theory, Oxford University Press, Inc

13. Lord Frederic (2009), Applications of item response theory to practical testing

problems. Routledge.

14. Dr._Remo_Ostini (2006), Dr._Michael, L._Nering, POLYTOMOUS ITEM

RESPONSE THEORY MODELS. Sage Publications, Inc.

15. Mark_D._Reckase (2009), Multidimensional Item Response Theory. Springer

16. Russell_Waugh (2010), Applications of Rasch Measurement. Nova Science, Inc.

17. By Dr. V. Natarajan (2009), Basic Principles of IRT . Ebook.

18. Margaret L. Wu Ray mond J. Adams (2007), ACER ConQuest, Version 2.0.

ACER Press

Guilford Press

19. R. J. de Ayala (2009), The Theory and Practice of Item Response Theory. The

102

20. Frank B. Baker, Seock-Ho Kim (2017), The Basics of Item Response Theory

Using R. Spring.

103

Bảng phụ lục 1: Phân phối chƣơng trình toán Lớp 12

Cả năm 123 tiết Đại số và Giải tích 78 tiết Hình học 45 tiết

Học kì I: 19 tuần (72 tiết) 48 tiết 24 tiết

Học kì II: 18 tuần (51 tiết) 30 tiết 21 tiết

TT Nội dung

Số tiết Ghi chú

Ứng dụng đạo hàm để khảo sát và vẽ đồ thị của hàm số:

Sự đồng biến, nghịch biến của hàm số. Cực trị của hàm số.

1 Giá trị lớn nhất và giá trị nhỏ nhất của hàm số. Đƣờng

20 Đại số 78

tiệm cận đứng, đƣờng tiệm cận ngang của đồ thị hàm số.

tiết

Khảo sát sự biến thiên và vẽ đồ thị của hàm số

(trong đó có

Hàm số luỹ thừa, hàm số mũ và hàm số lôgarit: Luỹ

16 tiết ôn

thừa. Hàm số luỹ thừa. Lôgarit. Hàm số mũ. Hàm số

2

17 tập, KT, trả

lôgarit. Phƣơng trình mũ và phƣơng trình lôgarit. Bất

bài và tổng

phƣơng trình mũ và lôgarit

ôn thi tốt

Nguyên hàm, Tích phân và ứng dụng: Nguyên hàm. Tích

nghiệp)

3

16 phân. Ứng dụng của tích phân trong hình học.

Số phức: Số phức. Cộng, trừ và nhân số phức. Phép chia

4

9 số phức. Phƣơng trình bậc hai với hệ số thực

Khối đa diện: Khái niệm về khối đa diện. Khối đa diện lồi

Hình học 45

5 và khối đa diện đều. Khái niệm về thể tích của khối đa

11 tiết

diện

(trong đó có

Mặt nón, mặt trụ, mặt cầu: Khái niệm về mặt tròn xoay.

6 tiết ôn

6

10 Mặt cầu

tập, KT, trả

bài và tổng

PP toạ độ trong không gian: Hệ toạ độ trong không gian.

ôn thi tốt

7 Phƣơng trình mặt phẳng. Phƣơng trình đƣờng thẳng trong

18 nghiệp)

không gian.

104

105

Phụ lục 2: Mẫu đặc tả kiến thức môn toán 12 theo chuẩn kiến thức kĩ năng bộ giáo dục ban hành.

Chủ đề 1. Ứng dụng đạo hàm

TT Nội dung Mức độ

Yêu cầu

Dạng câu hỏi

Chú ý

1. Khái niệm hàm đơn điệu (nắm vững khái niệm, các phản ví

- Nắm vững khái niệm

dụ)

- Nhận dạng đồ thị của hàm đơn điệu

2. Nhìn dạng đồ thị để biết hàm đơn điệu trên khoảng nào (Các

- Biết đƣợc mỗi liên hệ giữa dấu đạo

hàm thƣờng gặp hàm bậc 2, bậc 3,bậc 4 trùng phƣơng, phân

hàm với tính đơn điệu của đồ thị hàm

thức,…).

Nhận biết

số.

3. Hiểu đƣợc tính liên quan giữa dấu đạo hàm và tính đơn điệu

- Tìm khoảng đơn điệu của hàm số đơn

Tính đơn

của hàm số.

giản (đa thức, phân thức)

1 điệu của

4. Tìm khoảng đơn điệu của hàm số đơn giản (đa thức, phân thức

hàm số

đơn giản, lƣu ý các lỗi dễ sai – dấu đạo hàm bằng 0 rời rạc)

- Tìm khoảng đơn điệu của hàm số phức

1. Tìm khoảng đơn điệu của các hàm phức tạp (Lƣợng giác, dấu

tạp (căn thức, lƣợng giác, hàm chứa dấu

|.|, căn thức)

Thông

|.|, hàm phân thức phức tạp)

hiểu

2. Dấu hiệu nhận biết nhanh tính đơn điệu của một số hàm

- Nhận xét tính đơn điệu của một số

thƣờng gặp (hàm bậc 3, bậc 4 trùng phƣơng, bậc 1/bậc 1,…).

hàm cơ bản

106

3. - Tìm điều kiện của tham số để hàm số

1. Tìm m để hàm số đơn điệu trên khoảng.

Kĩ thuật

đơn điệu trên các khoảng cho trƣớc,

2. Tìm m để hàm số đơn điệu trên khoảng có độ dài bằng

hỏi để

Vận dụng

- Vận dụng tính đơn điệu trong đại số

tránh bấm

thấp

3. Tìm nghiệm của phƣơng trình.

(giải phƣơng trình, hệ phƣơng trình,

máy tính

4. Lồng ghép khái niệm đơn điệu với các bài toán khác.

min max,…)

1. Ứng dụng tính đơn điệu đặc trƣng của các hàm thƣờng gặp

Vận dụng

- Các bài toán thực tiễn.

2. Ứng dụng tính đơn điệu trong các bài toán so sánh, bất đẳng

cao

thức.

TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý

1. Tìm cực trị của hàm số đơn giản: hàm bậc 3,bậc 4, bậc Nắm vững khái niệm cực trị hàm số 2,.. Nhận biết hàm số, hình dáng đồ thi của hàm số Cực trị 2. Dựa bảng biến thiên để tìm cực trị 2 hàm số

Thông Biết cách tìm cực trị của hàm thƣờng 1. Tìm cực trị của các hàm phức tạp: chứa dấu |.|, căn

hiểu gặp thức,…

107

Nhận biết số cực trị qua dấu đạo

hàm. 1. Điều kiện để hàm số có cực trị, không có cực trị Vận dụng

thấp Điều kiện để hàm số cực trị, không 2. Biện luận số cực trị của hàm số

có cực trị

Giải các bài toán liên quan đến cực 1. Cực trị liên quan đến hàm bậc 3 Vận dụng trị hàm số đặc biệt hàm bậc 3, bậc 4 cao 2. Cực trị liên quan đến hàm bậc 4 trùng phƣơng

TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý

Nhận biết Khái niệm GTLN, GLNN 1. Từ BBT kết luận GTLN, GTNN của hàm số

Thông Tìm GTLN, GTNN của hàm số bằng 1. Biết tìm GTLN, GTNN của hàm số thƣờng gặp hiểu đạo hàm GTLN, 3 1. Tìm GTLN,GTNN của các hàm phức tạp (đổi ẩn, biến GTNN Tìm GTLN, GTNN của hàm số phức

đổi) về các hàm đơn giản Vận dụng tạp (đổi biến),

thấp 2. Tìm điều kiện để phƣơng trình, bpt có nghiệm, vô Ứng dụng bài toán tìm GTLN,

nghiệm, một nghiệm,… GTNN trong các bài toán biện luận

108

nghiệm phƣơng trình

1. Tìm GTLN, GTNN của các hàm nhiều biến Ứng dụng GTLN, GTNN trong các Vận dụng 2. Tìm GTLN, GTNN của các phức hợp: chứa nhiều loại bài toán bất đẳng thức, cực trị hàm cao hàm, biểu thức phức tạp, các bài toán ứng dụng trong sản nhiều biến xuất, hình học.

TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý

Khái niệm tiệm cận đứng, tiệm cận Nhận biết 1. Định nghĩa TCĐ, TCN ngang

1. Tìm TCĐ, TCN của đồ thị các hàm cơ bản Thông Tìm TCĐ, TCN của hàm số hiểu 2. Tính số TC của đồ thị hàm số

4 Tiệm Cận

Giải các bài liên quan đến đƣờng TC 1. Biện luận số tiệm cận của đồ thị hàm số Vận dụng Tìm điều kiện để đồ thị hàm số có thấp 2. Giải quyết các bài toán có yếu tố tiệm cận tiệm cận

Vận dụng

109

cao

TT Nội dung Mức độ Yêu cầu Dạng câu hỏi Chú ý

Khảo sát và vẽ đồ thị hàm số các 1. Nhận dạng đồ thi của các hàm thƣờng gặp: Hàm bậc 3, hàm thƣờng gặp bậc 4 trùng phƣơng, hàm phân thức bậc 1/bậc 1. Nhận biết Điều kiện để một điểm thuộc đồ thị 2. Nhận biết một điểm có nằm trên đồ thị hàm số một hàm số

Thông Nhận dạng hình dáng đồ thị các hàm 1. Phán đoán đồ thị của các hàm phức tạp có dựa vào các

Đồ thị hiểu thƣờng gặp tính chất của hàm số: tính đơn điệu, tính cực trị,… 5 hàm số

Các bài toán liên quan đền đồ thị: Vận dụng Biện luận số nghiệm, bài toán tiếp 1. Biện luận số nghiệm của hàm số thấp tuyến,…

1. Các bài toán sự tƣơng giao Vận dụng Các bài toán về tƣờng giao đồ thị,… cao 2. Các bài toán tổng hợp về đồ thị hàm số

110

Phụ lục 3: Định dạng biên soạn câu hỏi thi.

Mã số 36. KH: ĐD.B1.STT ( Câu hỏi khối đa diện mức độ thông hiểu (B) loại 1 gắn với số thứ tự của câu hỏi.

Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố cạnh hoặc góc đơn giản . Tính thể tích khối lăng trụ đứng có liên quan đến

yếu tố cạnh hoặc góc đơn giản

TT

Nội dung

Đáp án

Nhiễu 1

Nhiễu 2

Nhiễu 3

Ghi chú

Cho khối chóp tam giác đều S.ABC có cạnh

Chóp

tam đều,

đáy bằng a và cạnh bên bằng 2a. Tính thể

cho cạnh bên

ĐD.B1.1

tích V của khối chóp S.ABC.

Chóp tứ giác đều

Cho hình chóp tứ giác đều

có

cho cạnh bên

ĐD.B1.2

cạnh đáy bằng

cạnh bên bằng

Tính

thể tích V của khối chóp đã cho.

Cho khối chóp S.ABCD có đáy là hình

Cho tứ giác cho

vuông cạnh a, SA vuông góc với đáy và SC

đƣờng cao, góc

ĐD.B1.3

giữa cạnh bên mặt

tạo với mặt phẳng (ABC) một góc

. Tính

đáy

thể tích V của khối chóp đã cho.

….

111

Phụ lục 4. Đặc tả nội dung kiến thức từng câu hỏi theo ma trận trọng số trong đề thi.

CHỦ ĐỀ CÂU

MÔ TẢ

Đề 4 Đề 3 Đề 2 Đề 1

Nhận biết: Nhận biết đồ thị của hàm số bậc ba, bậc 4 trùng phƣơng , hàm số

, tƣơng

6

3

1 giao giữa các đồ thị đơn giản.

Nhận biết: Xác định khoảng đồng biến , nghich biến của hàm số bậc ba, hàm bậc bốn trùng

25

7

6

5

2 phƣơng thông qua bảng biến thiên của hàm số. Tƣơng giao giữa các đồ thị đơn giản.

Nhận biết: Nhận biết cực trị của hàm số bậc ba, bậc bốn thông qua bảng biến thiên. Số cực trị

1. Ứng

27

4

27

7

3 của các hàm bậc 3, bậc 4.

dụng đạo

hàm

để

Nhận biết: Nhận biết đồ thị có tiệm cận đứng và ngang của đồ thị hàm số

15

8

9

2

4 khảo

sát

Thông hiểu: Tìm điều kiện của tham số để hàm số đạt cực trị tại

; số cực trị của hàm số, số

và vẽ đồ

12

18

30

22

5 cực trị của hàm số của hàm số chứa tham số. Nhận dạng hàm số qua tính chất của BBT.

thị

của

Thông hiểu: Tìm khoảng đồng biến, nghịch biến của một hàm số với các hàm phức tạp hoặc

hàm số

14

15

13

6 nhận dạng đồ thị hàm số qua chiều biến thiên của nó.

(11 câu)

Thông hiểu: Tìm GTLN của hàm số trên một đoạn, tiệm cận của hàm số chứa mẫu thức phức tạp

18

28

12

27

7 .

Thông hiểu:Biện luận số nghiệm của phƣơng trình. Xác định tham số để hàm số bậc ba, bậc bốn

34

35

37

16

8 trùng phƣơng có điểm cực trị ,cực đại, cực tiểu, cực trị hàm chứa dấu |.|

Vận dụng: Xác định tham số để hàm số bậc ba, bậc bốn trùng phƣơng có điểm cực trị, cực đại,

35

34

33

9

112

cực tiểu thỏa mãn điều kiện cho trƣớc có liên qua đến khoảng cách, tam giác. Cực trị biểu thức

hai biến đơn giản hoặc một biến phức tạp. Các bài toán liên quan đến tham số về tính đồ thị hàm

số.

Vận dụng: Tìm điều kiện của tham số để hàm số đồng biến, nghịch biến trên một khoảng hoặc

Tìm điều kiện của tham số đề đồ thị hàm số và đƣờng thẳng cắt nhau tại điểm phân biệt thỏa mãn

43

32

42

10 điều kiện cho trƣớc. Định dạng của các đồ thị phức tạp.

Vận dụng cao: Tìm điều kiện của tham số hàm số lƣợng giác có tham số đồng biến, nghịch biến

trên một khoảng, biện luận tính chất đồ thị dựa vào dấu đạo hàm hoặc các bài toán ứng dụng thực

46

47

50

44

11 tế

Nhận biết: Định nghĩa, tính chất của lôgarit. Tính chất của hàm số lôgarit, đạo hàm của hàm số

8

5

17

6

12 logarit

Nhận biết: Tính chất của hàm số mũ,đạo hàm của hàm số mũ,

4

12

29

3 2. Hàm số

13 Nhận biết: Tính chất của hàm số lũy thừa, tập xác định của hàm số lũy thừa, đạo hàm của hàm

luỹ thừa -

9

21

39

20

14 số lũy thừa

hàm

số

Nhận biết: Cách giải phƣơng trình mũ cơ bản, phƣơng trình lôgarit cơ bản. Các phép biến đổi

mũ

và

1

13

8

18

15 hàm lũy thừa.

hàm

số

lôgarit

Thông hiểu: Giải các phƣơng trình mũ, lôgarit dạng thƣờng gặp, Tính toán biến đổi biểu thức

30

27

31

38

16 (10 câu)

logarit phức tạp.

Thông hiểu: Sử dụng công thức mũ, logarit biến đổi các biểu thức mũ logarit

23

32

36

26

17 Thông hiểu: Giải các bất phƣơng trình mũ , logarit dạng thƣờng gặp . Tìm tập xác định của hàm

19

31

23

41

18

113

số hàm số logarit. Tính toám biểu thức logarit phức tạp.

Thông hiểu: Đạo hàm, tính chất của hàm số mũ, logarit, lũy thừa dạng hàm hợp. Tập xác định

32

24

4

21

19 của hàm số hợp của hàm số lũy thữa, các bài toán ứng dụng đơn giản.

Vận dụng: Phƣơng trình , bất phƣơng trình, hệ phƣơng trình mũ chứa tham số, Phƣơng trình, bất

phƣơng trình , hệ phƣơng trình lôgarit chứa tham số, Cực trị hàm mũ, logarit. Nhận dạng đồ thị

36

25

43

20 với các tính chất đạo hàm của hàm số.

Vận dụng cao: Sử dụng công thức mũ,logarit, tính chất hàm số mũ, logarit trong các bài toán về

tính chất , giá trị lớn nhất , nhỏ nhất của hàm số hợp của hàm số mũ, hàm số logarit, Phƣơng trình

47

49

44

47

21 mũ phức tạp, các ứng dụng thực tế

Nhận biết: Khái niệm nguyên hàm, tích phân. Tìm họ nguyên hàm đơn giản

7

2

18

8

22 Nhận biết : Tính chất của nguyên hàm, tích phân và mối liên hệ giữa tích phân và nguyên hàm.

29

9

28

32

23 Tìm họ nguyên hàm của hàm số dựa vào bảng nguyên hàm, tính chất nguyên hàm

3. Nguyên

Thông hiểu : Tính tích phân của hàm số

17

20

42

25 hàm - tích

24 Thông hiểu : Ứng dụng tích phân trong bài toán diện tích, thể tích đơn giản

phân và

40

38

19

25 ứng dụng

Thông hiểu: Sử dụng tìm nguyên hàm, tích phân với các câu hỏi khác

26

29

46

30

26 (7 câu)

Vận dụng : Tính tích phân, kĩ thuật tính và ứng dụng

49

42

10

46

27 Vận dụng cao: Sử dụng tìm nguyên hàm, tính tích phân của hàm số với các bài toán liên quan

31

48

14

37

28 khác. Ứng dụng vào bài toán thực tế

Nhận biết: Xác định các tham số cơ bản của số phức

3

11

7

9

4. Số

29 phức

Nhận biết: Các phép toán cơ bản với số phức, Các dạng biểu diễn của số phức

11

6

2

4

30

114

Nhận biết: Nghiệm phƣơng trình bậc nhất, bậc hai hệ số thực của số phức.

(6 câu)

22

15

19

15

31 Thông hiểu: Các bài toán tính toán liên quan đến dạng biểu diễn của số phức, nghiệm phức của

38

20

40

32 phƣơng trình.

Thông hiểu: Các bài toán liên quan đến môđun, đến tính toán biểu thức phức

42

25

40

29

33 Vận dụng: Các tính toán phức tạp, các bài toán hình học liên quan đến mô đun số phức.

48

46

47

48

34 Nhận biết: Thể tích khối chóp dễ xác định đƣờng cao, diện tích đáy. Thể tích khối lăng trụ đứng

24

30

11

23

35 dễ xác định đƣờng cao, diện tích đáy

Thông hiểu: Tính thể tích khối chóp có liên quan đến yếu tố cạnh hoặc góc đơn giản . Tính thể

41

22

29

36 tích khối lăng trụ đứng có liên quan đến yếu tố cạnh hoặc góc đơn giản

Thông hiểu: Các khái niệm liên quan đến khối đa diện: Mặt, cạnh, đỉnh, mặt đối xứng,…, đa

5.

13

23

43

14

37 diện đều. Phân chia khối đa diện.

Thể tích

khối đa

Vận dụng: Tính thể tích khối chóp có sử dụng kiến thức ở mức độ cao hơn về quan hệ vuông

diện

góc, góc, khoảng cách để xác định đƣờng cao, diện tích đáy. Tính thể tích khối lăng trụ có sử

(5 câu)

dụng kiến thức ở mức độ cao hơn về quan hệ vuông góc, góc, khoảng cách để xác định đƣờng

21

16

35

12

38 cao, diện tích đáy. Tính thể tích khối lăng trụ, khối hộp xiên. Kết hợp khối tròn xoay và khối đa

diện.

Vận dụng cao: Tính thể tích khối chóp không xác định trực tiếp phải sử dụng thông qua tỉ số thể

44

48

45

39 tích, phân chia khối đa diện. Cực trị khối đa diện.

Nhận biết: Công thức thể tích khối nón, diện tích xung quanh, diện tích toàn phần của hình nón.

6.

5

39

13

31

40 Công thức tính thể tích khối trụ, diện tích xung quanh ,diện tích toàn phần hình trụ. Diện tích mặt

Khối tròn

115

cầu và thể tích khối cầu.

xoay

(3 câu)

Thông hiểu: Khối nón có liên quan thiết diện. Khối trụ có liên quan thiết diện

39

22

45

35

41 Vận dụng: Xác định tâm và tính bán kính mặt cầu ngoại tiếp khối chóp. Nón, trụ có liên quan

đến góc, khoảng cách, thiết diện. Thể tích khối trụ, diện tích xung quanh ,diện tích toàn phần

45

24

50

42 hình trụ- Bài toán thực tế.

Nhận biết: Các phép toán về véc tơ, điểm.

10

5

11

43 Nhận biết: Viết, xác định phƣơng trình mặt phẳng khi biết một điểm và một vec tơ pháp tuyến

20

1

21

10

44 Nhận biết: Viết, xác định phƣơng trình đƣờng thẳng khi biết một điểm và một vectơ chỉ phƣơng

2

17

3

24

45 Nhận biết: Viết phƣơng trình mặt cầu khi biết tâm và bán kính.

16

26

17

46 7. Phƣơng

Thông hiểu: Các bài toán viết phƣơng trình mặt phẳng, đƣờng thẳng cần xác định đƣợc vectơ

pháp tọa

pháp tuyến hay chỉ phƣơng liên quan điểm các đƣờng thẳng, mặt phẳng đặc biệt.(hình chiếu,

28

19

16

28

47 độ

trong

khoảng cách từ điểm lên các trục Ox, hay mặt phẳng (Oxy)

không

Thông hiểu: Các bài toán liên quan đến tƣơng giao, hình chiếu, khoảng cách của điểm, đƣờng

gian

33

34

48 thẳng, mặt phẳng.

(8 câu)

Vận dụng: Các bài toán tìm điểm trên mặt phẳng, đƣờng thẳng,… thỏa mãn các điều kiện cho

50

37

41

36

49 trƣớc.

Vận dụng cao: Ứng dụng hình giải tích vào hình không gian hoặc xử lý các bài toán cực trị hình

37

50

49

50 học liên quan đến véc tơ, điểm, mặt phẳng, mặt cầu, đƣờng thẳng.

116

Phụ lục 5: Đề thi thử nghiệm 01

TRƢỜNG THPT

(Đề thi có 06 trang) KÌ THI KIỂM TRA KIẾN THỨC LỚP 12 Môn: Toán Thời gian làm bài: 90 phút

Họ, tên thí sinh:.......................................................................... Số báo danh:............................................................................... Câu 1: Đƣờng cong trong hình bên là đồ thị của một trong bốn hàm số đƣợc liệt kê ở bốn phƣơng án A, B, C, D. Hỏi hàm số đó là hàm số nào ? A. B. C. D.

Câu 2: Tìm tất cả các tiệm cận của đồ thị hàm số

A. và

B. và

C. và

D. và

Câu 3: Cho hàm số

Mệnh đề nào dƣới đây sai ?

A. Hàm số đã cho có tập xác định là B. Hàm số đã cho đồng biến trên khoảng C. Đồ thị của hàm số đã cho có tiệm cận ngang là trục D. Đồ thị của hàm số đã cho đi qua điểm

là điểm biểu diễn của số phức nào dƣới đây

C. Câu 4: Trên mặt phẳng tọa độ, điểm ? A.

B. đồng biến trên khoảng nào dƣới đây ?

C.

D. Câu 5: Hàm số A.

B. bất kì. Mệnh đề nào dƣới đây đúng ? B. D.

Câu 6: Xét các số thực dƣơng A. C. Câu 7: Cho hàm số xác định, liên tục trên tập số thực và có bảng biến thiên nhƣ hình bên. Mệnh đề nào dƣới đây đúng ?

A. Cực đại của hàm số bằng -4. C. Cực đại của hàm số bằng 1.

B. Cực đại của hàm số bằng -3. D. Cực đại của hàm số bằng 0.

117

Câu 8: Tìm nguyên hàm của hàm số

A.

B.

C.

D. và phần ảo

B. Câu 9: Tìm phần thực A.

của số phức

C.

D. cho mặt phẳng

Câu 10: Trong không gian với hệ tọa độ Vectơ nào dƣới đây không phải là vectơ pháp tuyến của

A.

B.

C.

D. Câu 11: Trong không gian với hệ tọa độ

điểm nào dƣới đây thuộc mặt phẳng

A.

B.

C.

D. . Gọi

và

Câu 12: Cho hình lập phƣơng cạnh lần lƣợt là thể tích khối cầu ngoại tiếp, thể tích khối cầu nội tiếp và thể tích khối cầu tiếp xúc với tất cả các cạnh của hình lập phƣơng đã cho. Mệnh đề nào dƣới đây đúng ?

A.

B.

C.

D. có đạo hàm

Hỏi hàm số

đồng biến trên

B.

D. có các điểm

C. lần lƣợt nằm

Câu 13: Cho hàm số khoảng nào dƣới đây ? A. Câu 14: Cho tứ diện

trên hai cạnh

Hỏi hai mặt phẳng

và

thành bao nhiêu khối tứ diện ?

phân chia khối tứ diện A. B. C. D.

Câu 15: Tính môđun của số phức

biết

A.

B.

C.

D. có đồ thị nhƣ hình để có nghiệm thuộc khoảng

Câu 16: Cho hàm số bên. Tìm tất cả các giá trị của tham số thực phƣơng trình

A. B. C. D.

118

Câu 17: Trong không gian với hệ tọa độ

cho hai điểm

và

Phƣơng trình nào dƣới đây là phƣơng trình mặt cầu đi qua

và có tâm là

A.

B.

C.

D. của tất cả các nghiệm của phƣơng trình

Câu 18: Tính tổng A.

B.

D.

C. trục hoành, trục

Câu 19: Tính diện tích tung và đƣờng thẳng

của hình phẳng giới hạn bởi đồ thị ?

A.

B.

D.

C. Câu 20: Tìm tập xác định D của hàm số

A.

C.

B. D.

Câu 21: Tính đạo hàm của hàm số

A.

B.

C.

D. có bao nhiêu điểm cực tiểu ?

B. 2.

C. 3.

của khối lăng trụ tam giác đều có cạnh đáy bằng

D. 0. và chiều cao

Câu 22: Hàm số A. 1. Câu 23: Tính thể tích bằng

A.

B.

C.

D. Câu 24: Trong không gian với hệ tọa độ

cho điểm

và đƣờng thẳng

Phƣơng trình đƣờng thẳng đi qua

và song song với là:

A.

B.

C.

D. Câu 25: Cho hàm số

Tính

A.

B.

D.

C. Câu 26: Cho biểu thức

Mệnh đề nào dƣới đây đúng ?

A.

B.

D.

C. Câu 27: Tìm giá trị lớn nhất

của hàm số

119

A.

B.

C.

D. Câu 28: Trong không gian với hệ tọa độ

cho điểm

. Gọi

và

lần

lƣợt là hình chiếu vuông góc của

lên các trục

và

Viết phƣơng trình

mặt phẳng

A. C.

B. D.

Câu 29: Cho các số thực

và

thỏa mãn

Tính

A.

B.

D.

C. Câu 30: Hàm số nào dƣới đây không là nguyên hàm của hàm số

A.

B.

C.

D. Câu 31: Trong không gian, cho hình chữ nhật

có

Tính bán kính

của hình trụ nhận đƣợc khi quay hình chữ nhật

xung quanh trục

A.

B.

C. ? D.

Câu 32: Biết

tính

B.

D.

C. A. Câu 33: Tìm tất cả các giá trị của tham số thực

để đƣờng thẳng

cắt đồ thị

tại hai điểm phân biệt

sao cho trung điểm của đoạn

thuộc trục

hàm số

hoành.

A.

B.

C.

D. Câu 34: Trong không gian với hệ tọa độ

cho đƣờng thẳng

Viết phƣơng trình đƣờng thẳng

đối xứng với

qua mặt phẳng

A.

B.

C.

D. Câu 35: Hai hình chữ nhật có kích thƣớc đƣợc xếp chồng một phần lên nhau sao cho chúng đều nhận làm trục đối xứng tạo thành một hình phẳng nhƣ của vật thể tròn xoay sinh

hình bên. Tính thể tích bởi hình phẳng đã cho khi quay quanh A. C.

B. D.

120

Câu 36: Trong không gian với hệ tọa độ

cho hai điểm

và

đƣờng thẳng

Điểm

thay đổi thuộc

tính giá trị nhỏ nhất

của

tích vô hƣớng

A.

B.

C.

D. Câu 37: Một viên đá đƣợc bắn thẳng đứng lên trên với vận tốc ban đầu là 40 m/s từ một điểm cao 5 mét cách mặt đất. Vận tốc của viên đá sau t giây đƣợc cho bởi công thức (m/s). Tính độ cao lớn nhất viên đá có thể lên tới so với mặt đất.

A. 80 m.

B. 75 m.

C. 90 m.

D. 85 m.

Câu 38: Cho

theo

và

Tính

A.

B.

D.

C. Câu 39: Gọi

,

lần lƣợt là diện tích toàn phần của hình lập phƣơng

và diện tích toàn phần của tứ diện

Tính

A.

B.

C.

D. Câu 40: Cho

là số thực sao cho phƣơng trình

có một nghiệm phức là

Kí hiệu

là nghiệm còn lại của phƣơng trình đã cho và

Mệnh

đề nào dƣới đây đúng ?

A.

B.

C.

D. Câu 41: Tập hợp tất cả các số thực

thỏa mãn

là tập nào dƣới đây ?

A.

B.

C.

D. Câu 42: Tìm tất cả các giá trị của tham số thực

để hàm số

nghịch biến trên

C.

D.

B. khoảng A. Câu 43: Trong hình bên là đồ thị của và ba hàm số

(

và

là các số thực dƣơng khác 1). Mệnh đề nào dƣới đây đúng ? A. B. C. D.

121

Câu 44: Một màn ảnh hình chữ nhật cao 1,8 mét đƣợc đặt ở độ cao 2 mét so với tầm mắt (tính từ đầu mép dƣới của màn hình nhƣ hình bên). Để nhìn rõ nhất phải xác định vị trí đứng

sao cho góc nhìn lớn nhất (

gọi là góc

nhìn). Tính độ dài đoạn

B. A.

D. C.

có độ dài cạnh đáy bằng

thuộc cạnh

và

vuông góc với mặt phẳng

, điểm Tính thể tích

của khối

Câu 45: Cho hình chóp đều sao cho chóp

.

A.

B.

C.

D. Câu 46: Cho hàm số

có đồ thị nhƣ hình

bên (với

). Biết

và

Tính

A.

B.

C.

D. Câu 47: Tìm số nghiệm của phƣơng trình

A. 2.

B. 1.

C. 3.

D. 4.

Câu 48: Trong tất cả các số

thỏa mãn

tìm số phức

có môđun nhỏ nhất ?

A.

B.

C.

D. Câu 49: Trong không gian với hệ tọa độ

cho ba điểm

và

Tập hợp các điểm

sao cho

là một mặt cầu

điểm

nào dƣới đây là tâm của

A.

B.

C.

D.

122

Luận văn Thạc sĩ Giáo dục học: Triển khai đánh giá kết quả học tập môn Toán lớp 12 bằng một đề tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều

Mục tiêu nghiên cứu đề tài là nghiên cứu tập chung tìm hiểu cách xây dựng, thiết kế một đề thi môn toán lớp 12 và phân tích đánh giá đề thi theo lý thuyết đánh giá hiện đại (IRT). Mời các bạn cùng tham khảo!

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƢỜNG ĐẠI HỌC GIÁO DỤC

------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN LỚP

12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU HỎI NHỊ PHÂN,

ĐA PHÂN VÀ ĐA CHIỀU

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC

Hà Nội - 2017

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƢỜNG ĐẠI HỌC GIÁO DỤC

------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN

LỚP 12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU

HỎI NHỊ PHÂN, ĐA PHÂN VÀ ĐA CHIỀU

CHUYÊN NGÀNH: ĐO LƢỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC

Ngƣời hƣớng dẫn khoa học: GS.TSKH. LÂM QUANG THIỆP

Hà Nội - 2017

2

3

4

5

6

7

8

9

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

33

Hình 1.4. Đường cong đặc trưng của ĐTN gồm 5 CH và 5 đường cong ĐTCH tương ứng.

35

Hình 1.5. Đồ thị các hàm thông tin của các CH trắc nghiệm

và của ĐTN do các CH đó hợp thành

36

37

38

39

40

41

42

43

. Các thủ tục đƣợc sử dụng để phù hợp đƣờng cong dựa trên ƣớc

44

45

Số ngƣời trong nhóm

Nhóm năng lực (đƣợc phân chia bằng điểm số )

Xác xuất trả lời đúng p(θj) = rj / mj

Số câu trả lời đúng của nhóm năng lực trên tổng số ngƣời của nhóm 4

18

4

1

17

4

4

1

16

5