
Ngày nhận bài: 21-10-2024 / Ngày chấp nhận đăng bài: 25-11-2024 / Ngày đăng bài: 27-11-2024
*Tác giả liên hệ: Phạm Thị Mai Huyền. Khoa Khoa học Cơ bản, Đại học Y Dược Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt
Nam. E-mail: mhuyen@ump.edu.vn
© 2024 Bản quyền thuộc về Tạp chí Y học Thành phố Hồ Chí Minh.
156 https://www.tapchiyhoctphcm.vn
ISSN: 1859-1779
Nghiên cứu Y học
Tạp chí Y học Thành phố Hồ Chí Minh; 27(5):156-164
https://doi.org/10.32895/hcjm.m.2024.05.19
Phát triển phần mềm trực tuyến phân tích dữ liệu với mô
hình thang đánh giá Rating Scale
Phạm Thị Mai Huyền1,*, Vĩnh Sơn2, Phạm Lê An3, Nguyễn Anh Vũ1,2
1Khoa Khoa học Cơ bản, Đại học Y Dược Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam
2Phòng Đảm bảo chất lượng Giáo dục và Khảo thí, Đại học Y Dược Thành phố Hồ Chí Minh, Thành phố Hồ Chí
Minh, Việt Nam
3Trung tâm Y học Gia đình, Đại học Y Dược Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam
Tóm tắt
Đặt vấn đề: Trong lĩnh vực y tế và giáo dục, các phương pháp thống kê truyền thống gặp hạn chế khi xử lý dữ liệu thang
đo Likert cũng như đánh giá độ tin cậy của bộ câu hỏi. Nghiên cứu này tập trung vào việc khắc phục những hạn chế đó
bằng cách phát triển phần mềm phân tích dữ liệu trực tuyến mô hình đánh giá thang đo Rating Scale Model (RSM), cho
phép đánh giá độ khó câu hỏi và khả năng người trả lời trên cùng một thang đo, cung cấp thông tin chi tiết về cấu trúc
bộ câu hỏi và độ chính xác kết quả.
Mục tiêu: Phát triển một phần mềm trực tuyến thân thiện với người dùng, có kết quả phân tích dữ liệu chính xác tương
đương và trực quan hóa tốt hơn so với gói phần mềm R cùng chức năng.
Đối tượng và phương pháp nghiên cứu: Phần mềm RSM trực tuyến được phát triển, phần mềm R (gói eRm), dữ liệu
khảo sát sử dụng thang đo Likert. Phát triển phần mềm RSM trực tuyến với giao diện thân thiện, chạy cả hai phần mềm
trên cùng một tập dữ liệu khảo sát. Sau đó so sánh kết quả phân tích, đánh giá các chỉ số chất lượng bộ câu hỏi từ kết
quả của cả hai phần mềm.
Kết quả: Phần mềm RSM có giao diện dễ sử dụng, thân thiện với người dùng, kết quả phân tích đạt độ chính xác tương
đương với gói phần mềm eRm. Phần mềm cung cấp các công cụ trực quan để diễn giải kết quả tốt hơn eRm, có khả
năng hỗ trợ đánh giá chất lượng bộ câu hỏi, cải thiện thiết kế khảo sát.
Kết luận: Phần mềm trực tuyến RSM đạt kết quả mong đợi, có tiềm năng ứng dụng rộng rãi trong y tế, giáo dục và xã
hội, giúp phân tích dữ liệu khảo sát hiệu quả và chính xác hơn.
Từ khóa: thang đo Likert; lý thuyết trắc nghiệm cổ điển (CTT); mô hình đánh giá thang đo (RSM); lý thuyết đáp ứng câu
hỏi (IRT)

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 27 * Số 5 * 2024
https://doi.org/10.32895/hcjm.m.2024.05.19 https://www.tapchiyhoctphcm.vn | 157
Abstract
BUILDING AN WEB-BASED DATA ANALYSIS TOOL WITH RATING SCALE MODEL
Pham Thi Mai Huyen, Vinh Son, Pham Le An, Nguyen Anh Vu
Background: In healthcare and education, traditional statistical methods face limitations in handling Likert scale data
and assessing the reliability of questionnaires. This study focuses on overcoming these limitations by developing a
web-based data analysis software based on Rating Scale Model that places item difficulty and respondent ability on the
same scale, providing detailed information on the questionnaire structure and result accuracy.
Objective: To develop a user-friendly online software with accurate data analysis results and better visualization tools
compared to the R software package with the same functionality.
Methods: The research uses used web-based RSM software, eRm package of R software and survey data using from
the Likert Likert-scale questionnaire. The RSM software is was firstly developed with a user-friendly interface, then run
ran on the same survey dataset with eRm. Analysis results of both softwares are were compared and evaluated
following quality indicators of the used questionnaire
Results: The RSM software has was considered to have a user-friendly interface, provides provided analysis results in
the same level of accuracy as the eRm package but better visualization tools compared to eRm. The RSM software can
also support the assessment of questionnaire quality and improves survey design.
Conclusion: The RSM software meets expectations and has offered the potential for a wide range of applications in
healthcare, education, and social sciences, contributing to more efficient and accurate survey data analysis.
Keywords: likert scales; Classical Test Theory (CTT); Rating Scale Model (RSM); Item Response Theory (IRT)
1. ĐẶT VẤN ĐỀ
Trong lĩnh vực nghiên cứu tâm lý, giáo dục và xã hội, việc
phân tích dữ liệu khảo sát dựa vào thang đo đa mức đóng vai
trò quan trọng trong việc đánh giá hiệu quả của các chương
trình đào tạo, dịch vụ và chất lượng cuộc sống. Lý thuyết trắc
nghiệm cổ điển (CTT) có vai trò quan trọng trong việc đánh
giá tính giá trị của cấu trúc và độ tin cậy của thang đo. Đến
nay, CTT vẫn là công cụ được sử dụng phổ biến để phân tích
dữ liệu các khảo sát, do dễ dàng cung cấp các thống kê mô tả
thông dụng, có khả năng đánh giá cấu trúc bằng phân tích
CFA và độ tin cậy nhất quán nội bộ của thang đo với hệ số
Cronbach Alpha. Các tính năng của CTT có sẵn trong nhiều
phần mềm thống kê thông dụng như SPSS và STATA.
Tuy nhiên, các phương pháp phân tích thống kê truyền
thống dựa trên CTT thường gặp hạn chế trong việc xử lý dữ
liệu thang đo Likert và đánh giá độ tin cậy của bộ câu hỏi. Mô
hình thang đánh giá Rasch (RSM) đôi khi còn được gọi là mô
hình Rasch đa mức được Andrich (1978) phát triển cho dữ
liệu đa mức có hơn hai danh mục được sắp thứ tự. Mô hình
này cung cấp ước tính về đặc điểm của người trả lời, độ khó
của câu hỏi và một tập hợp ngưỡng tổng thể được giả định là
cố định trên các mục. Khoảng cách tương đối giữa các
ngưỡng là như nhau trên các mục, nhưng các mục vẫn có độ
khó khác nhau. Các ngưỡng chỉ dịch chuyển lên hoặc xuống
trên thang logit độ khó [1,2].
Các ưu điểm của RSM so với CTT [3], gồm có:
(1) Tính độc lập: Đối với RSM, độ khó câu hỏi độc lập với
mẫu khảo sát và đặc điểm đo được độc lập với bộ câu hỏi
khảo sát. Trong khi đó hạn chế của CTT là điểm số của một
người phụ thuộc vào bộ câu hỏi khảo sát cũng như độ khó câu
hỏi phụ thuộc vào nhóm người được khảo sát.
(2) Trọng số khác nhau cho từng câu hỏi: RSM đánh giá
mức độ khó của từng câu hỏi và gán trọng số phù hợp, trong
khi CTT gán trọng số như nhau cho tất cả các câu hỏi. Điều
này giúp RSM phản ánh chính xác hơn khả năng của người
tham gia khảo sát [4].

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 27 * Số 5 * 2024
158 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2024.05.19
(3) Đo lường trên cùng một thang đo: RSM chuyển đổi điểm
thô thành các phép đo khoảng (logit), cho phép so sánh trực
tiếp giữa khả năng của người tham gia và độ khó của câu hỏi.
Trong thang Likert, các mức từ “hoàn toàn không đồng ý” đến
“hoàn toàn đồng ý” là số đo thứ tự với khoảng cách giữa các
lựa chọn không chắc chắn đồng đều. Trong khi đó RSM tính
ngưỡng (threshold) giữa các lựa chọn và do đó chuyển thang
đo thứ tự này thành thang đo liên tục. Các tham số Infit MSQ,
Outfit MSQ cung cấp thông tin về tính nhất quán của một cụm
câu hỏi, tương tự như Cronbach Alpha nhưng nhiều thông tin
hơn. Chức năng DIF (Different Item Functioning) giúp phát
hiện đặc điểm khác nhau của câu hỏi trên hai hay nhiều nhóm
cùng năng lực [5]. Câu hỏi có đặc điểm DIF thực chất làm giảm
đi khả năng đo lường của bộ câu hỏi khảo sát, vì câu hỏi phụ
thuộc vào đặc điểm nhóm thay vì chỉ đo trên năng lực hoặc đặc
điểm cần đo. Bộ câu hỏi khảo sát sẽ không được coi là hợp lệ
nếu có nhiều câu hỏi DIF [6].
Tuy nhiên, RSM mang lại nhiều ưu điểm so với CTT trong
việc phân tích khảo sát sử dụng thang điểm Likert. RSM cung
cấp một cách tiếp cận đo lường chính xác và chi tiết hơn, giúp
đánh giá hiệu quả hơn khả năng của người tham gia và chất
lượng của thang đo. Do đó, nghiên cứu này được thực hiện
nhằm khắc phục những hạn chế trên bằng cách phát triển một
phần mềm phân tích RSM trực tuyến, sử dụng những ưu điểm
của RSM, cho phép đặt độ khó của câu hỏi và khả năng của
người trả lời lên cùng một thang đo, từ đó cung cấp những
thông tin chi tiết hơn về cấu trúc của bộ câu hỏi và độ chính
xác của kết quả khảo sát.
2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP
NGHIÊN CỨU
2.1. Đối tượng nghiên cứu
Phần mềm phân tích trực tuyến dựa vào mô hình RSM, gói
ứng dụng mở rộng eRm của phần mềm R có cùng chức năng
phân tích dữ liệu thang đo như phần mềm RSM được phát
triển, bộ dữ liệu kiểm thử.
2.2. Phương pháp nghiên cứu
2.2.1. Thiết kế nghiên cứu
Nghiên cứu phát triển ứng dụng phần mềm kết hợp với
nghiên cứu đánh giá. Trong đó nghiên cứu phát triển tập trung
vào thiết kế xây dựng giao diện, lập trình chức năng và đảm
bảo khả năng sử dụng, hiệu suất và tính bảo mật. Nghiên cứu
đánh giá được thực hiện sau khi phát triển phần mềm, bao
gồm tự đánh giá và đánh giá của chuyên gia.
2.2.2. Biến số nghiên cứu
Các tham số của câu hỏi: độ khó, giá trị phù hợp Infit mean
square và Outfit mean square, ngưỡng phân cách giữa các lựa
chọn của câu hỏi trong bộ câu hỏi khảo sát sử dụng thang đo
Likert.
Đặc trưng tính nhất quán của cụm câu hỏi liên quan đến
một đặc điểm khảo sát dựa vào giá trị Infit MSQ (<0,5: overfit
hoặc >1,6: under fit).
Biểu đồ đường cong đặc trưng của câu hỏi (ICC, Item
Characteristic Curve).
Các tham số của người tham gia khảo sát: năng lực, giá trị
phù hợp (Infit mean square và Outfit mean square).
Biểu đồ năng lực-độ khó (Wright map): Biểu đồ năng lực-
độ khó biểu diễn người và câu trên cùng một trục độ khó (từ
thấp đến cao), trực quan hóa sự phù hợp độ khó của bộ câu
hỏi với năng lực nhóm khảo sát.
2.2.3. Địa điểm nghiên cứu
Nghiên cứu được thực hiện tại Đại học Y Dược Thành phố
Hồ Chí Minh từ tháng 02 năm 2023 đến tháng 10 năm 2024.
2.2.4. Tiến trình phát triển phần mềm
Phần mềm đo lường Rasch đa mức đã hoàn thành giai đoạn
phát triển và kiểm thử chức năng ban đầu. Phần mềm được tổ
chức mã theo module, phát triển theo mô hình Scrum, theo
đó công việc phát triển phần mềm được chia thành các giai
đoạn Sprint [6]. Trong mỗi Sprint đều có các giai đoạn PDCA
(Plan-Do-Check-Act), mỗi Sprint có nhiệm vụ tạo một
module cho chức năng của phần mềm. Trong lập trình phần
mềm, nhóm nghiên cứu có tham khảo các phần mềm đo
lường khác như Winsteps, Quest, ConQuest.
Tiến trình phát triển gói phần mềm Rasch đa mức cũng tuân
theo quy trình PDCA (Plan-Do-Check-Act) như sau:
- Plan (Lập kế hoạch): Xác định mục tiêu, phạm vi và đối
tượng người dùng của phần mềm. Lựa chọn ngôn ngữ lập
trình PHP, cơ sở dữ liệu mysql, thuật toán JMLE, xây dựng
kế hoạch phát triển chi tiết.
- Do (Thực hiện): Thiết kế kiến trúc phần mềm và giao diện

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 27 * Số 5 * 2024
https://doi.org/10.32895/hcjm.m.2024.05.19 https://www.tapchiyhoctphcm.vn | 159
người dùng trên Web. Viết mã nguồn, thực hiện kiểm thử từng
module tính toán, module đồ họa và tích hợp các module.
- Check (Kiểm tra): Kiểm thử chức năng phần mềm bằng
bộ số liệu khảo sát sử dụng thang đo Likert. Phân tích kết quả
kiểm thử, đánh giá hiệu năng và độ chính xác của phần mềm.
Chúng tôi chọn một trong các gói R phổ biến cho Rasch đa
mức là gói eRm để làm đối chứng.
- Act (Hành động): Dựa trên kết quả kiểm thử với bộ số liệu
thứ cấp của dự án Nghiên cứu cảm xúc và ý chí người học tiếng
Anh trên dữ liệu chia sẻ OSF, nhóm nghiên cứu xác định các
vấn đề cần điều chỉnh, cải thiện mã nguồn và tối ưu hóa hiệu
năng phần mềm, triển khai phần mềm trong lãnh vực nghiên
cứu sức khỏe và giáo dục và tiếp tục hoàn thiện sản phẩm.
2.2.5. Triển khai vận hành hệ thống
Cấu trúc hệ thống đã được triển khai trên nền tảng web,
được phát triển bằng ngôn ngữ lập trình PHP với nhiều ưu
điểm như chạy nhẹ, linh hoạt và đa nền tảng, có thể được sử
dụng cho nhiều hệ điều hành khác nhau. Bảo mật OAuth 0.2
và WAF, Đường dẫn của phần mềm RSM của nghiên cứu là
http://basicstat.net/mcq2024/.
2.2.6. Quy trình nghiên cứu
Quy trình tự đánh giá được thực hiện với các bước: (1) định
nghĩa mục tiêu và tiêu chí đánh giá; (2) lựa chọn phương pháp
đánh giá; (3) thu thập dữ liệu; (4) phân tích dữ liệu; (5) báo
cáo kết quả. Trong đó mục tiêu đánh giá nhắm đến tính khả
dụng, hiệu quả và bảo mật của phần mềm. Các tiêu chí đánh
giá như chức năng, giao diện, hiệu suất, độ tin cậy, đáp ứng
nhu cầu người dùng. Chuẩn so sánh là gói eRm thuộc phần
mềm R có cùng chức năng phân tích dữ liệu thang đo như
phần mềm RSM được phát triển, quy trình so sánh được thực
hiện trên cùng một bộ số liệu khảo sát có sử dụng thang đo
Likert. Nghiên cứu sử dụng một bộ số liệu thứ cấp của dự án
nghiên cứu về cảm xúc và ý chí trong học ngoại ngữ của
người Ukraine học tiếng Anh, công bố tại địa chỉ
https://osf.io/ejftx/ thuộc nền tảng trực tuyến mã nguồn mở
được phát triển bởi Trung tâm Khoa học Mở (Center for Open
Science - COS), được Gavin Austin khởi tạo ngày 06/9/2023,
đặt mã định danh ngoài doi:10.17605/OSF.IO/EJFTX ngày
11/01/2024. Sau đó kết quả phân tích của cả hai phần mềm
được đối sánh. Các tính năng của phần mềm RSM cũng được
đánh giá, gồm khả năng phân tích dữ liệu, trực quan hóa kết
quả, và hỗ trợ đánh giá chất lượng bộ câu hỏi.
Đánh giá chuyên gia được thực hiện bởi bên thứ ba, độc
lập với phát triển phần mềm và người dùng, gồm có 01
chuyên gia tâm lý học giáo dục, 01 chuyên gia công nghệ
thông tin. Chuyên gia hiểu rõ về bản chất và mức độ tác động
của nghiên cứu, tự nguyện tham gia và nhận được đầy đủ
thông tin về nghiên cứu, quyền của người tham gia và bảo
mật thông tin cá nhân. Phương pháp phỏng vấn bán cấu trúc
được sử dụng khi tiếp xúc với chuyên gia.
2.2.7. Quy mô mẫu và lấy mẫu
Đối với tự đánh giá: Bộ số liệu thứ cấp thu được từ khảo sát
487 người Ukraine học tiếng Anh như là ngôn ngữ thứ hai về
3 đặc điểm: hỗ trợ từ bạn đồng trang lứa (Peer Support, PS), lo
lắng ngoại ngữ (Foreign LanguageAnxiety, FLA) và sẵn sàng
giao tiếp (Willingness To Communicate, WTC). Bộ câu hỏi
gồm 22 câu đánh giá với thang Likert 5 mức từ “hoàn toàn
không đồng ý” đến “hoàn toàn đồng ý”, trong đó 5 câu thuộc
chủ đề PS, 8 câu thuộc chủ đề FLA, 9 câu thuộc chủ đề WTC.
Đối với đánh giá chuyên gia: 01 chuyên gia phát triển phần
mềm, 01 chuyên gia tâm lý học giáo dục có kinh nghiệm phân
tích số liệu với thang đo Likert.
2.2.8. Phương pháp thống kê
Số liệu được quản lý bằng MS Excel 365, mô tả và kiểm
định thống kê bằng R 4.3.1 có phối kiểm lại bằng JASP
0.19.1.0. Biến định tính được mô tả bằng tần số và tỷ lệ phần
trăm, so sánh bằng kiểm định χ2 hoặc Fisher nếu tần số kỳ
vọng dưới 5. Biến định lượng được mô tả bằng giá trị trung
bình và độ lệch chuẩn, trung vị và khoảng phân vị, kiểm định
Shapiro-Wilk kiểm tra phân phối chuẩn, kiểm định Student
so sánh trung bình khi có phân phối chuẩn, kiểm định Mann-
Whitney so sánh trung vị khi phân phối không chuẩn. Hệ số
tương quan Pearson và tương quan nội ICC (Intraclass
Correlation Coefficient) được sử dụng để so sánh sự tương
đồng của kết quả phân tích dữ liệu thang đánh giá giữa phần
mềm RSM do nhóm nghiên cứu phát triển và phần mềm R
(gói eRm). Khác biệt có ý nghĩa thống kê khi p <0,05.
3. KẾT QUẢ
3.1. So sánh kết quả từ phần mềm RSM của
nghiên cứu với kết quả từ R (gói eRm) cho thấy
kết quả tương đồng với cả ba đặc điểm PS, FLA
và WTC

Tạp chí Y học Thành phố Hồ Chí Minh * Tập 27 * Số 5 * 2024
160 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2024.05.19
Với đặc điểm PS, kết quả phân tích thống kê mô tả (trung
bình, độ lệch chuẩn, trung vị, min, max, skewness, kurtosis)
của độ khó câu hỏi logit giữa phần mềm nghiên cứu và eRm
cho thấy sự tương đồng rất cao ở đặc điểm PS (Bảng 1).
Hệ số tương quan Pearson giữa hai biến độ khó bằng 1
(p <0,001), cho thấy sự tương quan tuyến tính hoàn hảo. Phân
tích ICC cho thấy sự phù hợp tuyệt đối giữa hai phương pháp
(Single measures: ICC = 0,9999991, KTC 95%: 0,9999914 –
0,9999999; Average measures: ICC = 0,9999996, KTC 95%:
0,9999957 – 1,0000000). Công cụ trực quan hóa cung cấp các
biểu đồ trên số liệu chuẩn hóa cho thấy sự tương đồng hoàn
hảo (Hình 1).
Đặc điểm FLA và WTC cho kết quả phân tích tương tự. So
sánh với kết quả chạy trên eRm ở cả 3 đặc điểm, kết quả từ
phần mềm nghiên cứu hoàn toàn tương đồng, ngoại trừ
package eRm không đưa trung bình độ khó câu hỏi về 0. Điều
này do eRm thực hiện phân tích IRT trong khi RSM thực hiện
phân tích Rasch.
3.2. Đánh giá tính nhất quán của cụm câu hỏi
Cụm PS: Các giá trị Infit MSQ không vượt quá giá trị miss
fit (<0,6 hoặc >1,4), do đó bảo đảm tính nhất quán của cụm
câu hỏi. Phân tích hệ số Cronbach Alpha từ phần mềm RSM
của nghiên cứu cũng cho thấy tính nhất quán này (Bảng 2).
Hệ số Cronbach's Alpha 𑁛 được sử dụng để đánh giá mức
độ nhất quán bên trong của nhóm 5 câu hỏi (PS01, PS02,
PS03, PS04, PS05) với 473 câu trả lời. Mức độ nhất quán tốt
(𑁛= 0,75, KTC 95% từ 0,71 đến 0,78).
Cụm FLA: Có 2 câu hỏi FLA04 và FLA05 có Infit MSQ
underfit (>1,4), phù hợp với Cronbach Alpha (Bảng 3).
Hệ số Cronbach's Alpha 𑁛 được sử dụng để đánh giá mức
độ nhất quán bên trong của nhóm 8 câu hỏi (FLA01, FLA02,
FLA03, FLA04, FLA05, FLA06, FLA07, FLA08) với 473
câu trả lời. Mức độ nhất quán chấp nhận được (nên chỉnh
sửa): 𑁛 = 0,62, KTC 95% từ 0,56 đến 0,67.
Câu hỏi không phù hợp: FLA04, FLA05.
Cụm WTC: Các giá trị Infit MSQ (Mean Square) đều nằm
trong khoảng chấp nhận được (<0,6 hoặc >1,4), cho thấy tính
nhất quán của cụm câu hỏi.
3.3. Chức năng trực quan hóa của phần mềm
nghiên cứu
Giao diện phần mềm (Hình 2).
Biểu đồ ICC (Hình 3).
Biểu đồ Wright (Hình 4).
Biểu đồ Wright của đặc điểm FLA cho thấy ngay phạm vi
phủ của 8 câu hỏi đặc điểm FLA rất hẹp so với phạm vi năng
lực của người được khảo sát. Nếu loại bỏ các câu hỏi FLA05
và FLA06, phạm vi phủ của bộ câu hỏi được mở rộng.
Đánh giá chuyên gia cho biết phần mềm chạy trên nền tảng
mạng, gọn nhẹ, dễ sử dụng và tính bảo mật được đảm bảo.
Về ưu điểm, phần mềm có giao diện người dùng trực quan
đơn giản, các yếu tố quan trọng được sắp xếp dễ sử dụng và
dễ theo dõi đối với người mới bắt đầu. Phần mềm nghiên cứu
đã chứng minh được tính chính xác và hiệu quả trong việc
phân tích dữ liệu thang đánh giá, đồng thời cung cấp các công
cụ trực quan hỗ trợ đánh giá chất lượng bộ câu hỏi. Phần mềm
này có nhiều khả năng trở thành một lựa chọn tốt cho người
dùng muốn thực hiện phân tích số liệu khảo sát với thang đo
đa mức một cách nhanh chóng mà không cần học lập trình R.
Tuy nhiên, nghiên cứu mới chỉ so sánh phần mềm được phát
triển và một ứng dụng eRm mở rộng của R mà chưa có so
sánh với các gói ứng dụng khác cũng có chức năng phân tích
tương tự, chẳng hạn như TAM. Số lượng phân tích còn hạn
chế, chưa phát triển các chức năng tính toán hiệu ứng trần,
hiệu ứng sàn và nhắm đích.
Bảng 1. Đặc điểm cá nhân ở học sinh tham gia nghiên cứu (n=976)
Độ khó
logit
Trung
bình ĐLC Trung vị Min Max Skewness SE, Skew Kurtosis
SE, Kurt Shapiro p
RSM 0 1,12 -0,4492
-1,1731 1,3649 0,427 0,913 -2,623 2 0,889 0,353
eRm 0 1,12 -0,4510 -1,1712 1,3661 0,43 0,913 -2,624 2 0,889 0,351