intTypePromotion=1
ADSENSE

Luận văn Thạc sĩ Toán học: Tìm hiểu về các phương pháp tạo chỉ số thống kê và ứng dụng

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:62

2
lượt xem
0
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong bài kiểm tra đánh giá năng lực, các phản hồi thô của học sinh có hai khía cạnh quan trọng là độ chính xác và thời gian phản hồi. Từ trước đến nay, ở các bài kiểm tra đánh giá người ta thường chỉ quan tâm đến độ chính xác của câu trả lời và dựa vào số câu đúng sai để đánh giá năng lực của học sinh. Mời các bạn cùng tìm hiểu nội dung luận văn.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Toán học: Tìm hiểu về các phương pháp tạo chỉ số thống kê và ứng dụng

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC KHOA HỌC TỰ NHIÊN —————————————– Nguyễn Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - Năm 2019
  2. ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC KHOA HỌC TỰ NHIÊN —————————————– Nguyễn Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SỐ THỐNG KÊ VÀ ỨNG DỤNG Chuyên ngành: Lý thuyết xác suất và thống kê toán học Mã số: 8460112.02 LUẬN VĂN THẠC SĨ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Trịnh Quốc Anh Hà Nội - Năm 2019
  3. Lời nói đầu Trong bối cảnh hội nhập quốc tế như hiện nay, việc nâng cao năng lực của đội ngũ cán bộ là một trong những yếu tố quan trọng nhất cần chú trọng; vì vậy, giáo dục và kiểm định đánh giá giáo dục là một phần then chốt giúp Việt Nam ta hiểu và phân tích được các thông tin để đối chiếu với mục tiêu, tiêu chuẩn đề ra, nhằm có những quyết định thích hợp để điều chỉnh, nâng cao chất lượng và hiệu quả giáo dục. Trong bài kiểm tra đánh giá năng lực, các phản hồi thô của học sinh có hai khía cạnh quan trọng là độ chính xác và thời gian phản hồi. Từ trước đến nay, ở các bài kiểm tra đánh giá người ta thường chỉ quan tâm đến độ chính xác của câu trả lời và dựa vào số câu đúng sai để đánh giá năng lực của học sinh. Tuy nhiên gần đây, với sự phát triển của máy tính và công nghệ thông tin, ta đã có thể dễ dàng ghi lại được thời gian phản hồi từng câu hỏi của học sinh khi cho làm kiểm tra trên máy tính để từ đó, đưa ra được kết quả chính xác hơn về năng lực của học sinh đó. Luận văn này là bước phát triển tiếp nối sau khóa luận của em, nghiên cứu thêm về yếu tố thời gian phản hồi trong đánh giá năng lực người học. Luận văn gồm ba chương. Chương 1: Kiến thức chuẩn bị. Chương này trình bày lại những kiến thức chuẩn bị về mô hình ứng đáp câu hỏi, phân phối chuẩn, phân phối lognormal để làm tiền đề nghiên cứu mô hình phản hồi thời gian lognormal ở chương hai. Các kiến thức về suy luận Bayes, phương pháp xích Markov và đặc biệt là giải thuật Gibbs cũng được nhắc lại để giúp cho phần ước lượng tham số ở chương hai và chương ba được rõ ràng hơn. Chương 2: Mô hình thời gian phản hồi ứng đáp câu hỏi lô-ga-rit chuẩn (Lognormal Item Response Theory). Chúng tôi giới thiệu lại về lịch sử phát triển của mô hình phản hồi thời gian, nói về động lực để áp dụng mô hình lô-ga-rít chuẩn cho thời gian phản hồi của thí sinh và so sánh nó với mô hình chuẩn cho thời gian phản hồi. Phương 1
  4. Lời nói đầu pháp ước lượng tham số bằng giải thuật Gibbs cũng được đưa ra ở phần này. Chương 3: Nghiên cứu thực nghiệm. Phần này trình bày lại rõ ràng hơn về nghiên cứu thực nghiêm đã áp dụng mô hình phản hồi thời gian lognormal cho phân tích dữ liệu trong bài thi thích ứng ở Mỹ cũng như sắp xếp mẫu, ước lượng tham số và xem xét độ phù hợp của mô hình. Luận văn được hoàn thành tại trường Đại học Khoa học tự nhiên - Đại học quốc gia Hà Nội, dưới sự hướng dẫn của TS. Trịnh Quốc Anh. Em chân thành cảm ơn thầy Trịnh Quốc Anh, các nghiên cứu sinh và học trò của thầy. Trong quá trình nghiên cứu, mặc dù còn nhiều sơ suất nhưng em đã được thầy tận tình dạy dỗ, hướng dẫn, cũng như động viên em trong suốt thời gian làm viêc. Ngoài ra em muốn gửi lời cám ơn sâu sắc đến các thành viên của nhóm seminar Xác suất thống kê, Đại học Khoa học tự nhiên đã góp ý rất nhiều trong quá trình em hoàn thành luận văn. Em cũng xin bày tỏ lòng biết ơn các thầy cô và cán bộ của trường Đại học khoa học tự nhiên đã quan tâm giúp đỡ trong quá trình học tập và nghiên cứu tại trường. Em cũng xin tỏ lòng biết ơn sâu sắc đến gia đình, bố mẹ, anh chị em và anh Phạm Hồng Việt đã bên cạnh đồng hành, giúp đỡ, tạo điều kiện trong suốt quá trình em học tập và làm luận văn thạc sĩ. Cảm ơn hai thiên thần bé nhỏ Hồng Quân, Hồng Ngọc đã là động lực to lớn giúp em cố gắng vượt qua những khó khăn trong quá trình nghiên cứu để hoàn thành được luận văn. Hà Nội, ngày 10 tháng 12 năm 2019 Nguyễn Phương Ly 2
  5. Mục lục Lời nói đầu 1 Danh mục ký hiệu và chữ viết tắt 8 1 Kiến thức chuẩn bị 10 1.1 Mô hình IRT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.3 Phân phối lognormal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.4 Suy luận Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.1 Suy luận Bayes cho biến ngẫu nhiên rời rạc . . . . . . . . . . . . 22 1.4.2 Suy luận của Bayes cho biến ngẫu nhiên liên tục . . . . . . . . . 23 1.5 Phương pháp xích Markov Monte Carlo (MCMC) . . . . . . . . . . . . 24 1.5.1 Phương pháp Monter Carlo . . . . . . . . . . . . . . . . . . . . 24 1.5.2 Phương pháp xích Markov Monte Carlo (MCMC) . . . . . . . . 26 1.6 Giải thuật Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.6.1 Bài toán sinh mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.6.2 Thuật toán Gibbs giải bài toán sinh mẫu . . . . . . . . . . . . . 29 2 Mô hình phản hồi thời gian ứng đáp câu hỏi lognormal 33 2.1 Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.2 Mô hình thời gian phản hồi lognormal IRT - LNIRT . . . . . . . . . . . 37 2.2.1 Giả thiết của mô hình . . . . . . . . . . . . . . . . . . . . . . . 37 2.2.2 Mô hình LNIRT . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.2.3 Mô hình chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.3 Ước lượng tham số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.3.1 Phân bố tiên nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 45 2.3.2 Phân bố hậu nghiệm . . . . . . . . . . . . . . . . . . . . . . . . 46 2.3.3 Giải thuật Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.3.4 Áp dụng giải thuật Gibbs để ước lượng tham số . . . . . . . . . 47 3
  6. MỤC LỤC 2.3.5 Độ phù hợp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3 Nghiên cứu thực nghiệm 50 3.1 Mô tả mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.2 Ước lượng tham số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.3 Độ phù hợp của mô hình . . . . . . . . . . . . . . . . . . . . . . . . . . 55 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO 60 4
  7. Danh sách hình vẽ [1] 1.1 Đường cong đặc trưng câu hỏi mô hình một tham số . . . . . . . . . 12 1.2 Vị trí độ khó của câu hỏi hoặc năng lực của thí sinh trên trục năng [1] lực/độ khó tương ứng với xác suất trả lời 0.5 . . . . . . . . . . . . . . 13 1.3 Hàm đặc trưng câu hỏi của năm câu hỏi trong mô hình một tham số.[1] 13 [1] 1.4 Hàm đặc trưng của ba câu hỏi trong mô hình hai tham số. . . . . . . 14 1.5 Hàm đặc trưng câu hỏi trong mô hình ba tham số.[1] . . . . . . . . . . 15 [wiki] 1.6 Hàm mật độ xác suất tuân theo phân phối chuẩn. . . . . . . . . . 16 1.7 Hàm mật độ xác suất tuân theo phân phối lognormal.wiki . . . . . . . . 19 [wiki] 1.8 Hàm phân phối xác suất tích lũy tuân theo phân phối lognormal. . 20 1.9 Minh họa thuật toán Gibbs . . . . . . . . . . . . . . . . . . . . . . . . 31 1.10 Sơ đồ khối giải thuật Gibbs . . . . . . . . . . . . . . . . . . . . . . . . 32 2.1 Biểu đồ miêu tả mô hình phân cấp của phản hồi và thời gian phản hồi (RT) trong các câu hỏi của bài kiểm tra ở cáp tiếp cận thứ ba.[6] . . . . 36 [6] 2.2 Ví dụ hai phép tính số học yêu cầu cường độ thời gian khác nhau. . . 39 2.3 Ảnh hưởng của tham số phân biệt đối với phân bố thời gian phản hồi (phần trên) và phân bố phản hồi (phần dưới). Bên trái là các hình với tham số phân biệt có giá trị nhỏ, phần bên phải có tham số phân biệt có giá trị lớn hơn. Diện tích phần trùng nhau của hai phân bố lớn hơn nếu giá trị tham số phân biệt lớn hơn.[4] . . . . . . . . . . . . . . . . . 43 3.1 Biểu đồ phân tán với trung bình và phương sai của thời gian phản hồi tính theo giây cho 48 câu (ảnh trên) và 2000 thí sinh trong mẫu (ảnh dưới).[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 3.2 Phân bố của thời gian phản hồi theo đơn vị giây của câu hỏi 3 (hình trên; N=760) và câu hỏi 13 (hình dưới; N=490).[4] . . . . . . . . . . . . 54 3.3 Ước lượng cường độ thời gian (βi ) và tham số độ phân biệt (αi ) trong mô hình lô-ga-rít chuẩn và mô hình chuẩn cho cả hai trường hợp không có ràng buôc và có ràng buộc của αi .[4] . . . . . . . . . . . . . . . . . . 54 5
  8. DANH SÁCH HÌNH VẼ 3.4 Phân bố của tham số tốc độ (τi ) đã ước lượng ở mô hình lô-ga-rít chuẩn và mô hình chuẩn cho cả hai trường hợp tham số αi không có ràng buộc và có ràng buộc.[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.5 Tổng quan độ phù hợp của mô hình lô-ga-rít chuẩn và mô hình chuẩn cho cả hai trường hợp tham số αi không có ràng buộc và có ràng buộc. Càng phù hợp thì đường cong càng gần với đường thẳng đơn vị y=x.[4] 56 3.6 Độ phù hợp của mô hình lô-ga-rít chuẩn cho câu hỏi tốt nhất và câu hỏi tệ nhất với cả hai trường hợp tham số αi không có ràng buộc và có ràng buộc. Càng phù hợp thì đường cong càng gần với đường thẳng đơn vị y=x[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 6
  9. Danh sách bảng 1.1 Định nghĩa và các giá trị tuân theo phân bố chuẩn: X ∼ N (µ, σ 2 ).[wiki] 16 2 1.2 Định nghĩa và các giá trị tuân theo phân bố lognormal ln(X) ∼ N (µ, σ ). [wiki] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.1 Số lượng câu hỏi của từng thí sinh trong mẫu.[4] . . . . . . . . . . . . . 52 [4] 3.2 Số thí sinh mỗi câu hỏi trong mẫu. . . . . . . . . . . . . . . . . . . . 52 3.3 Tỷ lệ quan sát được và tỷ lệ kỳ vọng của thí sinh có thời gian phản hồi nhỏ hơn phân vị 5 và 10 trong phân bố hậu nghiệm ở từng trường hợp câu hỏi.[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.4 Tỷ lệ quan sát được và tỷ lệ kỳ vọng của thí sinh có thời gian phản hồi nhỏ hơn phân vị 5 và 10 trong phân bố hậu nghiệm ở từng trường hợp câu hỏi.[4] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 7
  10. Danh mục các ký hiệu và chữ viết tắt Ω Không gian mẫu X, Y, Z... Biến ngẫu nhiên F (x), FX (x) Hàm phân phối tích lũy, hàm phân phối tích lũy của biến ngẫu nhiên X p(x), pX (x) Hàm mật độ xác suất, hàm mật độ xác suất của biến ngẫu nhiên X X∈F Biến ngẫu nhiên X có hàm phân phối tích lũy F C(FX ) Tập các hàm phân phối tích lũy liên tục E, EX Kì vọng (giá trị trung bình), giá trị kì vọng của biến ngẫu nhiên X Var, VarX Phương sai, phương sai của biến ngẫu nhiên X ϕ(t), ϕX (t) Hàm đặc trưng, hàm đặc trưng của biến ngẫu nhiên X X∼Y Biến ngẫu nhiên X tương đương với biến ngẫu nhiên Y Φ(x) Hàm phân phối chuẩn tắc φ(x) Hàm mật độ chuẩn tắc N (µ, σ 2 ) Phân phối chuẩn N (0, 1) Phân phối chuẩn tắc exp(a) Hàm e mũ ai Tham số độ phân biệt của câu hỏi trong mô hình IRT bi Tham số độ khó của câu hỏi trong mô hình IRT ci Tham số xác suất trả lời đúng ngẫu nhiên câu hỏi trong mô hình IRT αi Tham số độ dao động thời gian của câu hỏi trong mô hình LNIRT βi Tham số cường độ thời gian của câu hỏi trong mô hình LNIRT exp(a) Hàm e mũ 8
  11. DANH SÁCH BẢNG CTT Lý thuyết trắc nghiệm cổ điển - Classical Test Theory CH Câu hỏi TS Thí sinh IRT Lý thuyết ứng đáp câu hỏi - Item Response Theory ICC Đường cong đặc trưng của câu hỏi - Item Characteristic Curve LNIRT Lý thuyết ứng đáp câu hỏi lô-ga-rit chuẩn - Lognormal Item Response Theory MCMC Xích Markov Monte Carlo - Monte Carlo Markov Chain RA Độ chính xác của phản hồi - Response Accuracy RT Thời gian phản hồi - Response Time 9
  12. Chương 1 Kiến thức chuẩn bị 1.1 Mô hình IRT Lý thuyết Ứng đáp Câu hỏi (Item Response Theory - IRT) là một lý thuyết của khoa học về đo lường trong giáo dục, ra đời từ nửa sau của thế kỷ 20 và phát triển mạnh mẽ cho đến nay. Trước đó, Lý thuyết Trắc nghiệm cổ điển (Clasical Test Theory – CTT), ra đời từ khoảng cuối thế kỷ 19 và hoàn thiện vào khoảng thập niên 1970, đã có nhiều đóng góp quan trọng cho hoạt động đánh giá trong giáo dục, nhưng cũng thể hiện một số hạn chế. Các nhà tâm trắc học (psychometricians) cố gắng xây dựng một lý thuyết hiện đại sao cho khắc phục được các hạn chế đó. Lý thuyết trắc nghiệm hiện đại được xây dựng dựa trên mô hình toán học, đòi hỏi nhiều tính toán, nhưng nhờ sự tiến bộ vượt bậc của công nghệ tính toán bằng máy tính điện tử vào cuối thế kỷ 20 – đầu thế kỷ 21 nên nó đã phát triển nhanh chóng và đạt được những thành tựu quan trọng. Để đánh giá đối tượng nào đó CTT tiếp cận ở cấp độ một đề kiểm tra, còn lý thuyết trắc nghiệm hiện đại IRT tiếp cận ở cấp độ từng câu hỏi, do đó lý thuyết này thường được gọi là Lý thuyết Ứng đáp Câu hỏi. Ta sẽ quy ước gọi người có thuộc tính cần đo lường là thí sinh (person) và một đơn vị của công cụ để đo lường (test) là câu hỏi (item). Để đơn giản hóa mô hình nghiên cứu ta có các giả thiết sau: (i) Năng lực tiềm ẩn (latent trait) cần đo chỉ có một chiều (unidimensionality), hoặc ta chỉ đo một chiều của năng lực đó. (ii) Các câu hỏi là độc lập địa phương (local independence) , nghĩa là việc trả lời một câu hỏi không ảnh hưởng đến các câu hỏi khác. 10
  13. Chương 1. Kiến thức chuẩn bị Khi thỏa mãn hai giả thiết nêu trên thì không gian năng lực tiềm ẩn đầy đủ chỉ chứa một năng lực. Khi ấy, người ta giả định là có một hàm đặc trưng câu hỏi (Item Characteristic Function) phản ánh mối quan hệ giữa các biến không quan sát được (năng lực của TS) và các biến quan sát được (việc trả lời CH). Đồ thị biểu diễn hàm đó được gọi là đường cong đặc trưng câu hỏi (Item Characteristic Curve). Đối với các cặp thí sinh- câu hỏi(TS – CH), cần xây dựng một thang chung để biểu diễn các mối tương tác giữa chúng. Trước hết giả sử ta có thể biểu diễn năng lực tiềm ẩn của các TS bằng một biến liên tục θ dọc theo một trục, từ −∞ đến +∞. Khi xét phân bố năng lực của một tập hợp TS nào đó, ta gán giá trị trung bình của phân bố năng lực của tập hợp TS đó bằng không (0), làm gốc của thang đo năng lực, và độ lệch tiêu chuẩn của phân bố năng lực bằng 1. Tiếp đến, chọn một thuộc tính của CH để đối sánh với năng lực: tham số biểu diễn thuộc tính quan trọng nhất đó là độ khó b của CH. Cũng theo cách tương tự có thể biểu diễn độ khó của các CH bằng một biến liên tục dọc theo một trục, từ −∞ đến +∞. Khi xét phân bố độ khó của một tập hợp CH nào đó, ta chọn giá trị trung bình của phân bố độ khó đó bằng không (0), làm gốc của thang đo độ khó, và độ lệch tiêu chuẩn của phân bố độ khó CH bằng 1. Chúng ta sẽ bắt đầu bằng cách xây dựng một hàm đáp ứng CH cho một CH nhị phân, tức là CH mà câu trả lời chỉ có 2 mức: 0 (sai) và 1 (đúng). Giả thiết cơ bản sau đây của George Rasch, nhà toán học Đan Mạch, được đưa ra làm cơ sở để xây dựng mô hình hàm đáp ứng CH một tham số: Một người có năng lực cao hơn một người khác thì xác suất để người đó trả lời đúng một câu hỏi bất kì phải lớn hơn xác suất của người sau; cũng tương tự như vậy, một câu hỏi khó hơn một câu hỏi khác có nghĩa là xác suất để một người bất kì trả lời đúng câu hỏi đó phải bé hơn xác suất để trả lời đúng câu hỏi sau(Rasch,1960). Với giả thiết nêu trên, có thể thấy xác suất để một TS trả lời đúng một CH nào đó phụ thuộc vào tương quan giữa năng lực của TS và độ khó của CH. Chọn Θ để biểu diễn năng lực của TS, và β để biểu diễn độ khó của CH. Gọi P là xác suất trả lời đúng CH, xác suất đó sẽ phụ thuộc vào tương quan giữa Θ và β theo một cách nào đó, do vậy ta có thể biểu diễn Θ f (P ) = . (1.1) β trong đó f là một hàm nào đó của xác suất trả lời đúng. Lấy logarit tự nhiên của phương trình 1.1:   Θ ln f (P ) = ln = ln Θ − ln β = θ − b. (1.2) β 11
  14. Chương 1. Kiến thức chuẩn bị Để đơn giản, khi xét mô hình trắc nghiệm nhị phân, Rasch chọn hàm f chính là mức được thua (odds) O, hoặc khả năng thực hiện đúng (likelyhood ratio), tức P O= , biểu diễn tỉ số của khả năng trả lời đúng và khả năng trả lời sai. Như vậy: (1 − P ) P ln = θ − b. (1.3) 1−P P với ln được gọi là logit (log odds unit). Từ đó 1−P P = eθ−b . (1.4) 1−P Như vậy, ta có: P = (1 − P )eθ−b P = eθ−b − P eθ−b P + P eθ−b = eθ−b P (1 + eθ−b ) = eθ−b eθ−b P = 1 + eθ−b và biểu thức eθj −bi P (Xij , θj , bi ) = . (1.5) 1 + eθj −bi với θj là năng lực của thí sinh thứ j; bi là độ khó của câu hỏi thứ i; Xij là câu trả lời của thí sinh thứ j với câu hỏi thứ i chính là hàm đặc trưng của mô hình IRT 1 tham số (IRT 1 PL) hay còn gọi là mô hình Rasch. Biểu đồ ở Hình 1.1 mô ta đường cong đặc trưng của câu hỏi trong mô hình IRT 1 tham số. Về mặt ý [1] Hình 1.1: Đường cong đặc trưng câu hỏi mô hình một tham số nghĩa, mẫu số trong phương trình chỉ nhằm mục đích đảm bảo hàm số không bao giờ nhỏ hơn không hoặc lớn hơn 1. Phần thú vị nhất của phương trình 1.5 là tử 12
  15. Chương 1. Kiến thức chuẩn bị số exp(θj − bi ), ta thấy mô hình một tham số logistic đã dự đoán được xác suất trả lời đúng câu hỏi dựa vào mối tương quan giữa năng lực thí sinh θj và tham số câu hỏi bi . Tham số bi được gọi là tham số địa phương hay chính là tham số độ khó câu hỏi. Trong Hình 1.1, ta xác định trục ngang là trục năng lực θi , cũng chính là trục của độ khó bi . IRT đã quy đổi giữa năng lực của thí sinh với độ khó câu hỏi. Ví dụ 1.1.1. Một thí sinh có thể tìm được vị trí của bi trên trục năng lực/độ khó tương ứng với điểm xác suất dự đoán trả lời đúng Pij (θj − bi ) bằng 0.5. Điều này được thể hiện trong Hình 1.2. Câu hỏi có đường cong đặc trưng trong hình cho ta thấy để có xác suất trả lời đúng câu hỏi này là 0.5 thì năng lực của thí sinh bằng 1 hoặc cũng có thể hiểu độ khó của câu hỏi này là 1. Hình 1.2: Vị trí độ khó của câu hỏi hoặc năng lực của thí sinh trên trục năng lực/độ khó tương ứng với xác suất trả lời 0.5 [1] . Hình 1.3 cho ta thấy hàm đặc trưng của 5 câu hỏi có độ khó khác nhau (-2.2; -1.5; 0.0; 1.0 2.0) có độ dốc khác nhau trải dài trên khoảng xác định của năng lực thí sinh. Năm đường cong này chạy song song và không bao giờ cắt nhau. Hình 1.3: Hàm đặc trưng câu hỏi của năm câu hỏi trong mô hình một tham số.[1] 13
  16. Chương 1. Kiến thức chuẩn bị Mô hình IRT hai tham số Mô hình IRT một tham số được Birnbaum mở rộng bằng cách gán cho mỗi câu hỏi trong đề thi trắc nghiệm ứng với mộ độ phân biệt a khác nhau. Mô hình này được gọi là mô hình IRT hai tham số có hàm đặc trưng câu hỏi như sau eai (θj −bi ) P (Xij ; θj , bi , ai ) = . (1.6) 1 + eai (θj −bi ) Độ phân biệt của câu hỏi đặc trưng cho khả năng phân loại thí sinh. Thông thường độ phân biệt của câu hỏi có giá trị dương. Trong trường hợp câu hỏi sai hoặc mắc lỗi thiết kế thì độ phân biệt có thể mang giá trị âm. Câu hỏi có độ phân biệt dương càng lớn thì sự chênh lệch về xác suất trả lời đúng của các thì sinh có năng lực cao và năng lực thấp càng lớn. Nói một cách khác, câu hỏi có độ phân biệt cao phân loại thí sinh tốt hơn câu hỏi có độ phân biệt thấp. Ví dụ 1.1.2. Trong Hình 1.3 đường cong đặc trưng của các câu hỏi song song với nhau và không bào giờ cắt nhau; các câu hỏi có tham số độ khó khác nhau sẽ có đường cong đặc trưng di chuyển về bên trái hoặc phải trong khi hình dạng của chúng là không đổi. Ta sẽ thấy một biểu đồ khác hẳng ở Hình 1.4. Hai câu hỏi có cùng độ khó -1.0. Giống như trong mộ hình một tham số, xác suất câu trả lời bằng 0.5 cho ta độ khó của câu hỏi. Tuy nhiên, một đường cong (đường 1) dốc hơn hẳn đường còn lại (đường 2). Đó là do câu hỏi đó có tham số phân biệt ai lớn hơn. Tham số phân biệt ai còn được gọi là tham số độ dốc (slope parameter), giống như độ khó câu hỏi bi được gọi là tham số vị trí. Độ dốc của mô hình hai tham số tại b là a/4. Đường cong còn lại (đường 3) và đường cong thứ 2 có cùng độ dốc nhưng đường 3 chạy về phía bên phải nhiều hơn. Do đó, câu hỏi của đường 3 có cùng độ phân biệt với câu hỏi của đường hai nhưng có độ khó lớn hơn. Hình 1.4: Hàm đặc trưng của ba câu hỏi trong mô hình hai tham số.[1] 14
  17. Chương 1. Kiến thức chuẩn bị Mô hình IRT ba tham số Thực tế cho thấy, trong quá trình kiểm tra trắc nghiệm khách quan nhiều lựa chọn, thí sinh luôn dự đoán câu trả lời (theo cách chọn ngẫu nhiên một phương án hoặc theo cách loại suy dựa trên kinh nghiệm bản thân). Trong lí thuyết trắc nghiệm cổ điển, người ta giảm việc dự đoán của thí sinh khi trả lời câu hỏi bằng cách đưa vào điểm may rủi. Tuy nhiên, cách làm này có nhược điểm là xem các câu hỏi có độ may rủi như nhau. Điều này trái với thực tiễn vì thí sinh thường dự đoán để trả lời đúng câu hỏi khi gặp câu hỏi khó hơn là khi gặp câu hỏi dễ. Vì vậy, Birnbaum đề xuất thêm tham số cj ∈ (0, 1) vào mô hình IRT hai tham số để đo lường mức độ dự đoán của thí sinh khi trả lời câu hỏi trắc nghiệm trong mỗi câu hỏi. Mô hình với tham số đo lường mức độ dự đoán của thí sinh được gọi là mô hình IRT ba tham số có hàm đặc trưng câu hỏi như sau: eai (θj −bi ) P (Xij ; θj , bi , ai , ci ) = ci + (1 − ci ) . (1.7) 1 + eai (θj −bi ) Ví dụ 1.1.3. Hàm đặc trưng của một câu hỏi có mô hình ba tham số như Hình 1.5. Hình 1.5 biểu diễn hàm đặc trưng của câu hỏi 3 tham số a = 1.4, b = 0 và c = 0.3. Năng lực thấp nhất ở đồ thị là −4 và còn có thể thấp hơn thế nữa đến −∞, nhưng dường như đường cong có đường tiệm cận dưới là 0.2. Giống như trong mô hình một tham số và hai tham số, đường cong chuyển dần từ lồi đến lõm tại điểm θ = b, nhưng xác suất để trả lời đúng câu hỏi tại θ = b = 0 lúc này không còn là 0.5 nữa mà bằng c + (1 − c)/2 = 0.2 + 0.4 = 0.6. Hơn nữa, độ dốc tại điểm b lúc này là (1 − c)/4 thay vì là a/4. Hình 1.5: Hàm đặc trưng câu hỏi trong mô hình ba tham số.[1] 1.2 Phân phối chuẩn Phân phối chuẩn (normal distribution), còn gọi là phân phối Gauss, là một phân phối xác suất cực kì quan trọng trong nhiều lĩnh vực. Nó là họ phân phối có dạng tổng 15
  18. Chương 1. Kiến thức chuẩn bị quát giống nhau, chỉ khác tham số giá trị trung bình (µ) và phương sai (σ 2 ). Phân phối chuẩn tắc (standard normal distribution) là phân phối chuẩn với giá trị trung bình bằng 0 và phương sai bằng 1 (đường cong màu đỏ trong Hình 1.6). Phân phối chuẩn còn được gọi là đường cong chuông (bell curve) vì đồ thị của mật độ xác suất có dạng chuông. Ta có thể khảo sát phân phối chuẩn cho một biến ngẫu nhiên hoặc nhiều biến ngẫu nhiêu; hay nói cách khác ta có thể khảo sát phân phối cho biến ngẫu nhiên một chiều hoặc biến ngẫu nhiên nhiều chiều. Biến một chiều (Univariate) Biến ngẫu nhiên X tuân theo phân phối chuẩn X ∼ N (µ, σ 2 ) với tham số kỳ vọng µ và phương sai σ 2 , ta sẽ có các thông số như trong bảng 1.1. Định nghĩa Giá trị (x − µ)2   1 PDF-f (x) √ exp − 2 2πσ 2  2σ 1 x−µ CDF - F (x; µ, σ 2 ) +Φ 2 σ Kỳ vọng - E[X] µ Phương sai - V ar(X) σ2 Bảng 1.1: Định nghĩa và các giá trị tuân theo phân bố chuẩn: X ∼ N (µ, σ 2 ).[wiki]   x−µ Φ ở đây là 1 phân phối chuẩn đã được tính toán từ trước. σ Biểu đồ hàm mật độ xác suất tuân theo phân phối chuẩn có dạng như trong Hình 1.6 sau: [wiki] Hình 1.6: Hàm mật độ xác suất tuân theo phân phối chuẩn. Nhận xét: Phương sai σ 2 càng lớn thì mức độ phân tán xác suất cũng càng rộng, 16
  19. Chương 1. Kiến thức chuẩn bị đỉnh thấp hơn và trải rộng hơn.  Đường màu đỏ với µ = 0 và σ 2 = 1 thể hiện phân phối 2  1 x chuẩn tắc f (x) = √ exp − - đây là hàm Gauss (Gauss function). Phân phối 2π 2 này thường được dùng để tính các phân phối chuẩn khác qua các phép biến đổi tuyến tính. Thường các phân phối chuẩn được tính toán theo các phép biến đổi tuyến tính tức là dựa vào các phân phối chuẩn dễ tính và tính được từ trước (như phân phối chuẩn tắc) để ước lượng cho phân phối cần tính. Giờ ta sẽ tìm cách biểu diễn một phân phối chuẩn bất kì qua phân phối chuẩn tắc. Giả sử Y = aX + b thì Y cũng sẽ là phân phối chuẩn có luật phân phối là: Y ∼ N (aµ + b, a2 σ 2 ). X −µ Ta có Z − score của phân phối chuẩn là Z = . σ 1 µ Nếu đặt a = và b = − . Ta sẽ biểu diễn được Z tuyến tính theo X với dạng: σ σ Z = aX + b. Như vậy, Z sẽ tuần theo phân phối chuẩn: Z ∼ N (aµ + b, a2 σ 2 )   1 µ 1 2 ∼N µ − , 2σ σ σ σ ∼ N (0, 1). Như vậy Z tuân theo phân phối chuẩn tắc nên ta có thể biến đổi ngược lại để thu được phép biểu diễn phân phối chuẩn qua phân phối của Z. FX (x) = P (X ≤ x)   X −µ x−µ =P ≤ σ σ   x−µ =P Z≤ σ   x−µ =Φ . σ   x−µ Phân phối tích lũy chuẩn tắc Φ có thể tra cứu từ các bảng tính có sẵn nên σ ta hoàn toàn có thể tích được các phân phối chuẩn khác qua nó. Biến đa chiều (Multivariate) Đây là tổng quát hoá của phân phối chuẩn đối với biến ngẫu nhiên một chiều và sử dụng cho hợp của nhiều biến ngẫu nhiên - véc-tơ ngẫu nhiên. Giả sử véc-tơ ngẫu nhiên 17
  20. Chương 1. Kiến thức chuẩn bị có số chiều là k:X = [X1 , X2 , ..., Xk ]T . Lúc đó phân phối chuẩn của nó sẽ được tham số hóa bởi: • Vecto kỳ vọng: µ = E[X] = [E[X1 ], E[X2 ], ..., E[Xk ]]T . = E[(X − µ)(X − µ)T ] = [Cov(Xi , Xj ), 1 ≤ i, j ≤ k]. P • Ma trận hiệp phương sai: Phân phối này sẽ được kí hiệu là X ∼ Nk (µ, Σ) hoặc giản lược k là X ∼ N (µ, Σ) và có hàm mật độ xác suất   1 1 | −1 f (x) = p exp − (x − µ) Σ (x − µ) . det(2πΣ) 2   µX Ví dụ với trường hợp có 2 biến ngẫu nhiên x, y (k=2) ta sẽ có véc-to kỳ vọng µ = µ Y  2  σX ρσX σY và ma trận hiệp phương sai Σ = . Hàm mật độ xác suất lúc đó sẽ có ρσX σY σY2 dạng (x − µx )2 (y − µy )2    1 1 2(x − µx )(y − µy ) f (x) = exp − 2 + − . (1.8) 2(1 − ρ2 ) σY2 p 2πρX ρY 1 − ρ2 σX σX σY 1.3 Phân phối lognormal Phân phối xác suất loga chuẩn hay phân phối lognormal (Lognormal distribution) là phân phối thống kê các giá trị logarit từ một phân phối chuẩn có liên quan. Phân phối lognormal có thể được chuyển hóa thành phân phối chuẩn và ngược lại bằng cách sử dụng các tính toán logarit liên quan. Cụ thể, nếu biến ngẫu nhiên X có phân bố lognormal, thì Y = ln(X) có phân bố chuẩn. Hoặc ngược lại, nếu biến Y có phân bố chuẩn thì hàm mũ của Y là X = exp(Y ) có phân bố lognormal. Cho Z là biến chuẩn tắc, µ và σ > 0 là hai số thực thì phân bố của biến ngẫu nhiên X = eµ+σZ được gọi là phân bố lognormal với tham số µ và σ. Như vậy, tham số µ và σ là giá trị kỳ vọng (hay trung bình) và độ lệch chuẩn logarit của biến tự nhiên chứ không phải kỳ vọng và độ lệch chuẩn của biến X. Mối quan hệ này đúng bất kể với hàm số logarit hay hàm số mũ. Với hai số dương a, b 6= 1, nếu loga (X) tuân theo phân bố chuẩn thì logb (X) cũng vậy. Tương tự, với 0 < a 6= 1, nếu eY tuân theo phân bố lognormal thì aY cũng như vậy. Thông thường, các tham số µ∗ = eµ và σ ∗ = eσ thường hay được sử dụng hơn. Với tham số này ta có thể lý giải trực tiếp: µ∗ là trung bình của phân bố và σ ∗ hữu ích cho việc xác định khoảng phân tán. 18
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2