BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
ĐÀO HỒNG NAM
DẠY HỌC XÁC SUẤT - THỐNG KÊ
Ở TRƯỜNG ĐẠI HỌC Y
LUẬN ÁN TIẾN SĨ KHOA HỌC GIÁO DỤC
TP. HỒ CHÍ MINH, 2014
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
ĐÀO HỒNG NAM
DẠY HỌC XÁC SUẤT - THỐNG KÊ
Ở TRƯỜNG ĐẠI HỌC Y
Chuyên ngành : Lý luận và phương pháp dạy học bộ môn Toán
Mã số
: 62.14.01.11
LUẬN ÁN TIẾN SĨ KHOA HỌC GIÁO DỤC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS. TS LÊ THỊ HOÀI CHÂU
PGS.TS ALAIN BIREBENT
TP. HỒ CHÍ MINH, 2014
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết
quả nêu trong luận án là trung thực và chưa từng được ai công bố trong bất kì công
trình nào khác.
Tác giả luận án
MỤC LỤC
MỤC LỤC
DANH MỤC CÁC BẢNG
DANH MỤC HÌNH ẢNH, SƠ ĐỒ
CÁC TỪ, CỤM TỪ VIẾT TẮT TRONG LUẬN ÁN
MỞ ĐẦU .................................................................................................................... 1
1. LÝ DO CHỌN ĐỀ TÀI ....................................................................................... 1
1.1. Vai trò của Xác suất – Thống kê trong y học ............................................... 1
1.2. Xác xuất – Thống kê trong đào tạo cán bộ y tế ở Việt Nam ........................ 3
1.3. Tổng quan về tình hình nghiên cứu trên chủ đề "DH Xác suất –Thống kê" ...... 5
1.4. Định hướng nghiên cứu của chúng tôi ........................................................ 11
2. LỰA CHỌN CÔNG CỤ LÝ THUYẾT ............................................................ 12
3. MỤC TIÊU, PHƯƠNG PHÁP VÀ NỘI DUNG NGHIÊN CỨU .................... 12
4. GIẢ THUYẾT KHOA HỌC ............................................................................. 16
5. NHỮNG LUẬN ĐIỂM CẦN BẢO VỆ ............................................................ 16
6. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN ....................................................... 17
7. CẤU TRÚC LUẬN ÁN .................................................................................... 18
CHƯƠNG 1. CƠ SỞ LÝ LUẬN ............................................................................ 19
1.1. DIDACTIC TOÁN ...................................................................................... 19
1.1.1. Tổng quan về các công cụ lý thuyết đặc trưng của Didactic Toán .......... 20
1.1.2. Hợp thức hóa ngoại vi và hợp thức hóa nội tại........................................ 21
1.2. YẾU TỐ MÔI TRƯỜNG TRONG DIDACTIC TOAN ............................. 25
1.3. THUYẾT NHÂN HỌC TRONG DIDACTIC TOÁN ................................ 26
1.3.1. Tri thức và thể chế ................................................................................... 27
1.3.2. Sự chuyển hóa sư phạm (transposition didactique) ................................. 27
1.3.3. Quan hệ thể chế và quan hệ cá nhân với một đối tượng tri thức ............. 29
1.3.4. Tổ chức toán học: một công cụ phân tích quan hệ thể chế ...................... 30
1.3.5. Tổ chức didactic: một công cụ phân tích thực hành DH của GV ............ 32
1.4. HỢP ĐỒNG DH .......................................................................................... 35
1.5. SAI LẦM VÀ HỢP ĐỒNG DH .................................................................. 37
1.6. ĐỒ ÁN DH .................................................................................................. 38
1.6.1. Khái niệm đồ án DH ................................................................................ 38
1.6.2. Chức năng kép của đồ án DH .................................................................. 39
1.6.3. Các pha khác nhau của việc nghiên cứu một đồ án DH ......................... 39
1.7. PHÂN TÍCH TRI THỨC LUẬN TRONG DIDACTIC TOÁN ................. 42
1.7.1. Về thuật ngữ phân tích tri thức luận ........................................................ 42
1.7.2. Lợi ích của phân tích tri thức luận ........................................................... 43
1.8. VẤN ĐỀ MÔ HÌNH HÓA TRONG DH TOÁN ........................................ 46
1.8.1. Về các thuật ngữ mô hình hóa, mô hình và mô hình toán học ................ 46
1.8.2. Quá trình mô hình hóa ............................................................................. 47
1.9. KẾT LUẬN chương 1 ................................................................................. 49
CHƯƠNG 2. XÁC SUẤT – THỐNG KÊ VÀ Y HỌC TỪ TOÁN HỌC
ĐẾN NHỮNG NGHIÊN CỨU THỰC TIỄN ĐẦU TIÊN ........... 50
2.1. NHỮNG ỨNG DỤNG CƠ BẢN CỦA XS-TK TRONG
NGHIÊN CỨU Y HỌC ............................................................................... 51
2.1.1. Chọn mẫu ................................................................................................. 52
2.1.2. Ước lượng khoảng tin cậy và kiểm định giả thuyết thống kê.................. 52
2.1.3. Tương quan và hồi quy ............................................................................ 53
2.1.4. Các mô hình nghiên cứu trong y học ....................................................... 54
2.2. THỰC TIỄN SỬ DỤNG XS-TK: MỘT SỐ SAI LẦM TÌM THẤY ............ 60
2.2.1. Không đảm bảo nguyên tắc lấy mẫu........................................................ 60
2.2.2. Bỏ qua điều kiện của các phép kiểm định ............................................... 61
2.2.3. Biến đổi và phân nhóm biến số không theo quy luật ............................... 64
2.2.4. Sai sót trong phân tích tương quan .......................................................... 64
2.2.5. Ý nghĩa thống kê và ý nghĩa lâm sàng ..................................................... 66
2.2.6. Thiết kế nghiên cứu không có nhóm chứng ............................................ 67
2.3. XS-TK TRONG CHẨN ĐOÁN – ĐIỀU TRỊ ............................................... 69
2.3.1. Độ chính xác của một XN ....................................................................... 69
2.3.2. Giá trị tiên đoán ....................................................................................... 72
2.3.3. Mô hình ngưỡng ...................................................................................... 72
2.4. MỘT NGHIÊN CỨU THỰC TIỄN DẠY HỌC MÔ HÌNH NGƯỠNG ....... 74
2.4.1. Các praxéologie cần dạy .......................................................................... 74
2.4.2. Phân tích thực tế DH ................................................................................ 78
2.5. KẾT LUẬN CHƯƠNG 2 ............................................................................... 81
CHƯƠNG 3. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÀ PHÂN PHỐI
CHUẨN: MỘT PHÂN TÍCH TRI THỨC LUẬN ....................... 83
3.1. PHÂN TÍCH TRI THỨC LUẬN VỀ KIỂM ĐỊNH GIẢ THUYẾT TK ....... 83
3.1.1. Kiểm định giả thuyết thống kê trong lịch sử ......................................... 85
3.1.2. Mô hình kiểm định giả thuyết thống kê được sử dụng trong y học
hiện nay ................................................................................................. 90
3.2. PHÂN TÍCH TRI THỨC LUẬN VỀ PHÂN PHỐI CHUẨN ....................... 91
3.2.1. Lịch sử hình thành khái niệm PPC .......................................................... 92
3.2.2. Các giai đoạn nảy sinh và phát triển ...................................................... 102
3.2.3. Phạm vi tác động, bài toán và đối tượng liên quan ............................... 105
3.3. KẾT LUẬN CHƯƠNG 3 ............................................................................. 106
CHƯƠNG 4. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÀ PHÂN
PHỐI CHUẨN: MỘT NGHIÊN CỨU THỂ CHẾ .................. 108
4.1. XS-TK TRONG CHƯƠNG TRÌNH ĐÀO TẠO NGÀNH Y ...................... 110
4.1.1. XS-TK trong chương trình khung do Bộ Giáo dục và Đào tạo quy định .... 110
4.1.2. Chương trình XS-TK ở Đại học Y dược Tp HCM ............................... 111
4.2. PHÂN TÍCH GIÁO TRÌNH V1 VÀ SÁCH BÀI TẬP V2 .......................... 113
4.2.1. PPC trong XS ......................................................................................... 114
4.2.2. PPC trong ước lượng khoảng tin cậy ..................................................... 118
4.2.3. PPC trong KĐ giả thuyết TK nói chung ................................................ 119
4.2.4. PPC trong bài toán KĐ giả thuyết TK về hai tỷ lệ ................................ 122
4.2.5. PPC và bài toán KĐ giả thuyết về hai trung bình .................................. 127
4.2.6. Những tổ chức toán học liên quan đến KĐ giả thuyết TK .................... 133
4.2.7. Nhận xét về phần KĐ giả thuyết TK trong V1 và V2 ........................... 134
4.3. CÁC ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IF, O) ......................... 135
4.3.1. Những điểm giống nhau ........................................................................ 136
4.3.2. Những điểm khác nhau .......................................................................... 137
4.4. Các ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IA, O) .......................... 144
4.4.1. Sự giống nhau ........................................................................................ 146
4.4.2. Sự khác nhau .......................................................................................... 147
4.5. KẾT LUẬN CHƯƠNG 4 ............................................................................. 150
CHƯƠNG 5. NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA
GIẢNG VIÊN VÀ QUAN HỆ CÁ NHÂN CỦA SINH
VIÊN VỚI ĐỐI TƯỢNG O ......................................................... 152
5.1. NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA GIẢNG VIÊN ............... 152
5.1.1. TỔ CHỨC TOÁN HỌC CẦN DẠY VÀ ĐƯỢC DẠY ........................ 153
5.1.2. TỔ CHỨC DIDACTIC .......................................................................... 153
5.2. THỰC NGHIỆM KIỂM CHỨNG GIẢ THUYẾT KHOA HỌC ................ 162
5.2.1. Mô tả thực nghiệm ................................................................................. 162
5.2.2. Phân tích tiên nghiệm ............................................................................ 163
5.2.3. Phân tích tiên nghiệm bài toán 1............................................................ 166
5.2.4. Phân tích tiên nghiệm bài toán 2............................................................ 169
5.2.5. Phân tích hậu nghiệm ............................................................................. 172
5.3. KẾT LUẬN CHƯƠNG 5 ............................................................................. 173
CHƯƠNG 6. CÁC GIẢI PHÁP SƯ PHẠM VÀ NGHIÊN CỨU
THỰC NGHIỆM ......................................................................... 175
6.1. CƠ SỞ ĐỀ XUẤT GIẢI PHÁP ................................................................... 175
6.1.1. Cơ sở lí luận ........................................................................................... 175
6.1.2. Kết quả phân tích tri thức luận .............................................................. 175
6.1.3. Kết quả phân tích quan hệ thể chế, quan hệ cá nhân ............................. 176
6.2. CÁC GIẢI PHÁP SƯ PHẠM ...................................................................... 176
6.2.1. Giải pháp 1 ............................................................................................. 176
6.2.2. Giải pháp 2 ............................................................................................. 176
6.2.3. Giải pháp 3 ............................................................................................. 177
6.2.4. Giải pháp 4 ............................................................................................. 177
6.2.5. Giải pháp 5 ............................................................................................. 177
6.3. NHỮNG KẾT QUẢ CHỦ YẾU RÚT RA TỪ PHÂN TÍCH TRI THỨC
LUẬN VỀ KĐ GIẢ THUYẾT TK .............................................................. 178
6.4. XÂY DỰNG ĐỒ ÁN ................................................................................... 179
6.4.1. Các bài toán cơ sở của đồ án ................................................................. 179
6.4.2. Dàn dựng kịch bản ................................................................................. 180
6.4.3. Phân tích tiên nghiệm bài toán 1 và 2 .................................................... 181
6.5. PHÂN TÍCH HẬU NGHIỆM ...................................................................... 182
6.5.1. Tình huống 1 ......................................................................................... 184
6.5.2. Tình huống 2 .......................................................................................... 188
6.5.3. Tình huống 3 .......................................................................................... 190
6.6. KẾT LUẬN CHƯƠNG 6 ............................................................................. 191
KẾT LUẬN CỦA LUẬN ÁN ............................................................................... 192
DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ .......................................... 194
DANH MỤC TÀI LIỆU THAM KHẢO ............................................................. 195
A. Tiếng Việt .................................................................................................... 195
B. Tiếng Anh .................................................................................................... 200
C. Tiếng Pháp ................................................................................................... 203
DANH MỤC CÁC BẢNG
Bảng 2.1. Nồng độ CRP ............................................................................................ 53
Bảng 2.2. Kết quả thử nghiệm vaccine cúm ............................................................. 59 Bảng 2.3. Hàm lượng huyết sắc tố và Na+ trước và sau mổ ...................................... 62
Bảng 2.4. Kết quả XN máu và nước tiểu ................................................................. 71
Bảng 3.1. Các mức ý nghĩa giữa năm 1837 và 1908 ................................................ 87
Bảng 4.1. Phân phối chương trình XS-TK .............................................................. 112
Bảng 4.2. Bảng phân phối XS của biến ngẫu nhiên X ............................................ 114
Bảng 4.3. Các kiểu nhiệm vụ và kỹ thuật liên quan đến phép kiểm u và t ............. 133
Bảng 4.4. Phân phối chương trình XS-TK trong V1 và F ...................................... 136
Bảng 4.5. Sự khác nhau giữa 3 giáo trình V1, F và A ............................................ 150
Bảng 5.1. Kết quả TK các chiến lược được sử dụng .............................................. 173
Bảng 6.1. Kết quả thực nghiệm bài toán 1 và 2 ...................................................... 184
DANH MỤC HÌNH ẢNH, SƠ ĐỒ
Sơ đồ 1.1. Hệ thống tối tiểu cần nghiên cứu ............................................................. 20
Sơ đồ 1.2. Tác động phản hồi của môi trường ......................................................... 26
Sơ đồ 1.3. Sự chuyển hóa sư phạm giữa các cấp độ tri thức .................................... 27
Hình 1.1. Các mảnh ghép trên miếng bìa hình chữ nhật ........................................... 40
Sơ đồ 1.4. Quá trình mô hình hóa ............................................................................. 49
Hình 2.1. Mô hình ngưỡng P - K .............................................................................. 73
Hình 3.1. Phân phối chuẩn ....................................................................................... 86
Sơ đồ 4.1. Phân bố các phép kiểm trong V1 ........................................................... 141
Sơ đồ 4.2. Phân bố các phép kiểm trong F .............................................................. 142
Hình 5.1. Biểu đồ nồng độ HbA1c, nhóm 1 ........................................................... 167
Hình 5.2. Biểu đồ nồng độ HbA1c, nhóm 2 ........................................................... 167
Hình 5.3. Biểu đồ nồng độ lysozyme nhóm 1 ......................................................... 170
Hình 5.4. Biểu đồ nồng độ lysozyme nhóm 2 ......................................................... 170
Hình 5.5. DL hoán chuyển Y1 = ln(X1) ................................................................. 171
Hình 5.6. DL hoán chuyển Y2 = ln(X2) ................................................................. 171
CÁC TỪ, CỤM TỪ VIẾT TẮT TRONG LUẬN ÁN
VIẾT TẮT VIẾT ĐẦY ĐỦ
DH Dạy học
DL Dữ liệu
GV Giảng viên
HS Học sinh
KĐ Kiểm định
PPC Phân phối chuẩn
SV Sinh viên
TK Thống kê
XN Xét nghiệm
XS Xác suất
XS-TK Xác suất - Thống kê
tr Trang
Tp HCM Thành phố Hồ Chí Minh
1
MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
1.1. Vai trò của Xác suất – Thống kê trong y học
• Y học – một khoa học thực nghiệm không thể thiếu công cụ Xác suất – Thống kê
Bản chất của các chẩn đoán trong y học luôn bao hàm ý nghĩa xác suất (XS).
Khi khám bệnh, thông qua việc khám lâm sàng, bác sĩ sẽ nhận định người đến khám
bị bệnh B với một giá trị XS nào đó, XS này gọi là XS tiền nghiệm. Nếu XS này
vẫn chưa đủ để khẳng định hoặc loại trừ bệnh thì bác sĩ sẽ chỉ định các xét nghiệm
(XN) để hỗ trợ chẩn đoán. Dữ liệu (DL) từ các XN mang lại, từ các dữ kiện y học,
từ kinh nghiệm lâm sàng, từ thông tin của bệnh nhân, … kết hợp với các phương
pháp của xác suất - thống kê (XS-TK) sẽ là cơ sở để đưa ra chẩn đoán đúng và chọn
phương pháp điều trị thích hợp cho bệnh nhân.
Không chỉ thế, các bác sĩ còn phải nghiên cứu và hiểu được các phương pháp
của XS-TK để có thể đánh giá về độ tin cậy của những kết quả được trình bày trong
y văn, áp dụng chúng vào điều trị và chăm sóc bệnh nhân. Họ cần phải biết chẩn
đoán nào là tốt nhất, phương pháp điều trị nào là tối ưu. Họ phải giải thích được các
số liệu thống kê (TK) mô tả tình trạng sức khỏe dân số,… Những công việc kể trên
chỉ là một phần nhỏ trong công việc hàng ngày của bác sĩ mà ở đó kiến thức về XS-
TK luôn cần thiết.
Đối với các nhà nghiên cứu y học, XS-TK cũng là mảng kiến thức không thể
thiếu. Chẳng hạn, trong dịch tễ học, một ngành khoa học nghiên cứu về sức khỏe và
bệnh tật của con người, XS-TK được sử dụng để xác định, tìm hiểu và đánh giá các
yếu tố nguy cơ, nguyên nhân gây bệnh, xác định chính sách y tế cộng đồng,…
Tóm lại, cũng như mọi khoa học thực nghiệm khác, các thành tựu của y học
đều là những kết quả nghiên cứu được hình thành từ việc điều tra hay thử nghiệm
trên một (hoặc một số) mẫu rút ra từ tổng thể. Đặc trưng đó khẳng định vai trò quan
trọng của XS-TK trong y học.
2
• Vai trò của XS - TK trong Y học thực chứng
Thế nhưng, cái chân lý tưởng như hiển nhiên này không phải là đã được thừa
nhận sớm trong y học.
Suốt nhiều thế kỷ qua cho đến hiện nay, quá trình và phương pháp chẩn đoán,
điều trị bệnh chủ yếu dựa trên mô hình của Aristotle (Nguyễn Văn Tuấn, 2004).
Theo mô hình này, người thầy thuốc khám lâm sàng dựa trên những triệu chứng mà
bệnh nhân mô tả, sau đó dự đoán khả năng bệnh nhân mang bệnh B nào đó với một
XS ban đầu (XS tiền nghiệm), rồi quyết định phương pháp điều trị. Nếu sau điều trị,
bệnh diễn tiến tốt hoặc khỏi hoàn toàn thì phương pháp điều trị đã thực hiện được
xem là đúng. Qua nhiều lần điều trị, người thầy thuốc sẽ rút ra kinh nghiệm cho
mình và truyền thụ cho đồng nghiệp. Như vậy, phương pháp điều trị theo mô hình
Aristotle chủ yếu dựa trên kinh nghiệm và người thầy thuốc thường có khuynh
hướng chủ quan vì cảm nhận rằng phương pháp điều trị của mình là tốt, là tối ưu,
Nhiều phương pháp trị liệu hiện hành không có hiệu nghiệm như chúng ta tưởng.
Thậm chí, trong quá trình điều trị, người thầy thuốc còn có thể gây nên thương tổn cho
bệnh nhân. Nhưng đó không phải là vấn đề. Vấn đề là những kinh nghiệm của bác sĩ
rút ra từ kinh nghiệm quan sát lâm sàng hàng ngày thường không có độ tin cậy cao.
Thêm vào đó, phần lớn các phương pháp chữa trị trong y học chưa bao giờ được kiểm
tra, đánh giá bằng các phương pháp khoa học. Những phương pháp này được dùng vì
bác sĩ tin rằng chúng có hiệu nghiệm, và cũng như mọi niềm tin tôn giáo, nó không
dựa vào bằng chứng khoa học. (Nguyễn Văn Tuấn, 2004)
mặc dù có bằng chứng khoa học chứng minh điều ngược lại.
Sự thiếu căn cứ khoa học xác đáng của phương pháp truyền thống dựa vào mô
hình Aristotle đã dẫn đến việc hình thành nên một phương pháp khác, đó chính là
phương pháp y học thực chứng (Evidence-based medicine) (Beth Dawson, Robert
G.Trapp, 2004)
Gần đây, y học thực chứng đã và đang trở thành một cuộc cách mạng trong
nghiên cứu y học, trong chẩn đoán và điều trị bệnh. Đây là một phương pháp thực
hành y khoa không chỉ dựa vào kinh nghiệm mà còn dựa vào các DL y khoa đã
3
được TK lại hoặc đã được công bố trên các tạp chí có uy tín về y học, kết hợp giữa
Mặc dù còn nhiều ý kiến khác nhau, về y học thực chứng nhưng sự hiện diện và phát
triển của phong trào y học thực chứng, tự nó, đã nói lên một sự thật là trong thời đại
thông tin, những người hành nghề y khoa không còn là những anh hùng hào hiệp như
thủa xa xưa. Những thuật chữa trị ngoạn mục ngày càng ít đi. Penicillin cho bệnh sưng
màng óc, streptomycin cho bệnh lao, salk vaccine cho bệnh Polio, v.v… chỉ là những
viên đạn huyền diệu của quá khứ. Ngày nay, chúng ta chết không phải vì bệnh lao, vì
bệnh truyền nhiễm, mà vì những bệnh như tim mạch, ung thư, những bệnh do nhiều
yếu tố gây nên, và do đó, không dễ gì có được một viên đạn huyền diệu để chữa trị.
(Nguyễn Văn Tuấn, 2004)
kinh nghiệm lâm sàng với thông tin từ bệnh nhân.
Trong y học thực chứng, việc phân tích DL bằng các mô hình TK đóng một
vai trò then chốt. TK cung cấp cho nhà nghiên cứu một công cụ để phân tích và xử
lí DL, để hiểu và suy diễn ý nghĩa của các sự kiện. Giá trị khoa học và độ tin cậy
của kết luận từ một nghiên cứu không chỉ phụ thuộc vào thiết kế nghiên cứu, mục
đích nghiên cứu, phương pháp đo lường và thu thập DL, … mà còn phụ thuộc một
phần lớn vào việc áp dụng đúng phương pháp TK và các điều kiện cần và đủ của
các phương pháp này.
1.2. Xác xuất – Thống kê trong đào tạo cán bộ y tế ở Việt Nam
Ở nước ta, y học thực chứng chỉ mới được chú ý đến trong thời gian gần đây
và chưa có sự phát triển vững mạnh với những lý do khác nhau. Một mặt, do sự quá
tải của các bệnh viện, bác sĩ ít có thời gian dành cho bệnh nhân, ít có thời gian
nghiên cứu khoa học. Mặt khác, TK học ở nước ta chưa được chú ý và đầu tư đúng
mức, chưa có sự kết hợp giữa người làm TK và người sử dụng TK trong các lĩnh
vực nghiên cứu. Vì những lý do này mà các đề tài nghiên cứu chưa được đánh giá
cao, ít được ứng dụng trong thực tế và ít có cơ hội xuất hiện trên các tập san
quốc tế.
Nhưng, lý do quan trọng hơn cả mà chúng tôi nhận ra trên cương vị một giảng
viên (GV) giảng dạy môn XS-TK ở trường Đại học Y Dược Tp HCM là phương
pháp DH XS-TK còn nặng về kiến thức hàn lâm, chủ yếu xoay quanh các kiến thức
cơ bản, chưa đi sâu khai thác ứng dụng của XS-TK đối với từng chuyên ngành. Hơn
4
thế, theo quy định của chương trình dành cho các trường đại học Y – Dược, XS-TK
được đưa vào giảng dạy từ năm thứ nhất, khi mà hầu như SV chưa được trang bị gì
đáng kể về khối kiến thức y học. Điều đó khiến cho GV khó có thể làm cho SV thấy
rõ vai trò của XS-TK trong chẩn đoán, điều trị và nghiên cứu khoa học. Sự bất hợp
lý này khiến SV vừa thiếu động cơ học tập môn học XS-TK, vừa ít hoặc không có
cơ hội sử dụng XS-TK trong chẩn đoán, điều trị và nghiên cứu.
Hậu quả là nhiều bác sĩ gặp khó khăn khi tiến hành một nghiên cứu y học. Họ
thường phải mời chúng tôi làm tư vấn, thậm chí tham gia nghiên cứu cùng họ, giải
quyết giúp họ khâu phân tích DL.
Khó khăn đó còn được bộc lộ qua nhiều sai lầm tìm thấy trong các công trình
nghiên cứu thuộc lĩnh vực Y học (đã công bố), từ việc chọn mẫu đến việc xử lý DL
và ước lượng hay kiểm định (KĐ) giả thuyết TK. Để minh họa, chúng tôi nêu dưới
đây sai lầm tìm thấy trong một đề tài nghiên cứu khảo sát sự tăng Hcy của bệnh
nhân có huyết khối tắc mạch.
Để so sánh tỷ lệ tăng Hcy giữa 2 nhóm huyết khối động mạch và huyết khối
tĩnh mạch tác giả đề tài đã dựa vào bảng số liệu sau (Bảng 1):
Bảng 1. Tỷ lệ tăng Hcy trên bệnh nhân huyết khối tắc mạch
Bằng cách sử dụng phép kiểm chi bình phương để phân tích DL, tác giả đi đến
kết luận: Tỷ lệ tăng Hcy nhóm huyết khối động mạch cao hơn nhóm huyết khối tĩnh
mạch (p = 0,024).
Theo lý thuyết TK, phép kiểm chi bình phương chỉ có hiệu lực tốt khi có ít
hơn 20% số ô trong bảng tính có tần số lý thuyết nhỏ hơn 5 và không có ô nào có
tần số lý thuyết nhỏ hơn 1. Nếu không thỏa mãn điều này thì phải dùng hiệu chỉnh
Yates hoặc ghép hàng/cột lân cận sao cho tần số lý thuyết không nhỏ hơn 5
(Betty R. KirKwood, 2003).
5
Bảng 1 rơi vào trường hợp này: có một ô có tần số thực nghiệm nhỏ ( in = 0),
in = 11×22/46 = 2,87 < 5). Như vậy, việc thực hiện
dẫn tới tần số lý thuyết rất nhỏ ( '
2
2χ = 3,48 <
hiệu chỉnh Yates là cần thiết. Điều đáng nói là nếu thực hiện hiệu chỉnh Yates thì
0,05 (1)χ
= 3,84 (p = 0,0621) từ đó ta lại có kết luận ngược với tác giả: Tỷ
lệ tăng Hcy nhóm huyết khối động mạch và nhóm huyết khối tĩnh mạch khác nhau
không ý nghĩa. Ngoài ra, đề tài này còn vi phạm một nguyên tắc khác khi dùng phép
kiểm chi bình phương: phép kiểm này chỉ được sử dụng đối với những biến định
tính độc lập, không thể sử dụng cho các biến định lượng.
Sai lầm trên chỉ là một trong những loại sai lầm không phải là hiếm thấy trong
các công trình nghiên cứu y học. Điều đó minh chứng cho khó khăn của nhiều nhà
nghiên cứu khi cần sử dụng XS-TK. Chính vì thế, việc tìm ra những sai lầm điển
hình thường gặp là một phần nghiên cứu thực tiễn mà chúng tôi sẽ trình bày đầy đủ
hơn trong chương 2 của luận án.
Những ghi nhận về vai trò của XS-TK trong y học và khó khăn của các bác sĩ
khi cần sử dụng XS-TK vào nghiên cứu cũng như vào hoạt động nghề nghiệp
thường ngày của họ đã khiến chúng tôi lựa chọn đề tài Dạy học Xác suất - Thống kê
ở trường Đại học Y.
1.3. Tổng quan về tình hình nghiên cứu trên chủ đề "DH Xác suất –Thống kê"
DH XS-TK luôn là một chủ đề được nhiều nhà nghiên cứu quan tâm. Liên
quan đến chủ đề này, với những tư liệu tìm hiểu được, chúng tôi thấy có ba xu
hướng nghiên cứu gắn với ba mục đích:
- Giúp người học nhìn thấy quan hệ gắn bó mật thiết giữa XS và TK
- Giúp người học hiểu được nghĩa của các khái niệm cơ bản trong XS-TK
- Giúp người học phát triển tư duy TK
Thực ra thì ba xu hướng nghiên cứu này không tách rời nhau. Nhìn thấy mối
liên hệ giữa XS với TK được xây dựng trên cơ sở hiểu nghĩa của tri thức: nó được
sinh ra để giải quyết vấn đề gì ? có quan hệ ra sao với các tri thức khác ? Rồi chính
việc hiểu nghĩa của tri thức, hiểu quan hệ giữa XS với TK lại là nền tảng để hình
thành tư duy TK, theo đó người học phải biết phương pháp phân tích DL, ý thức
6
được sự rủi ro (risk) hay độ tin cậy (confidence) của những kết luận rút ra từ mẫu,
Giảng dạy thống kê không chỉ nhắm vào các công thức hoặc là các biểu đồ. Thống kê
không chỉ là một tập hợp các kĩ thuật, đó là sự rèn luyện tư duy, một cách để nắm bắt
dữ liệu, đặc biệt là biết được sự tồn tại của những cái không chắc chắn, sự thay đổi của
thông tin và việc thu thập dữ liệu. Nó cho phép đưa ra quyết định trong những tình
huống không chắc chắn. (Bair, Hasbroeck, 2002)
từ đấy thấy được vai trò của việc chọn mẫu:
Gắn với ba xu hướng đó người ta thường nói đến vấn đề mô hình hóa trong
DH XS-TK. Điều này hoàn toàn tự nhiên, vì hai lẽ: thứ nhất, XS-TK là một khoa
học ứng dụng, nên nói đến XS-TK thì phải nói đến mô hình hóa toán học (quy trình
giải quyết một vấn đề ngoài toán học bằng công cụ toán học); thứ hai, muốn người
học hiểu nghĩa của tri thức cần dạy, muốn phát triển tư duy TK thì phải gắn tri thức
với vấn đề mà việc sử dụng nó mang lại một lời giải tối ưu chứ không thể trình bày
tri thức một cách hình thức.
Vì có rất nhiều công trình bàn về chủ đề DH XS-TK nên trong khuôn khổ có
hạn của luận án và với nguồn tư liệu có được chúng tôi chỉ điểm qua dưới đây một
số công trình đại diện cho ba xu hướng này.
• Một số công trình của tác giả nước ngoài
- Henry M. (1994) có khá nhiều bài viết về chủ đề DH XS-TK. Các công trình của
ông tập trung bàn đến việc DH các tính toán XS ở bậc trung học từ ba quan điểm –
lịch sử, tri thức luận và didactic. Cách tiếp cận của ông nhằm mục đích giúp người
học nắm được nghĩa của khái niệm, tránh việc dạy những kiến thức hình thức.
- Coutigno C. (2001) trong khuôn khổ luận án tiến sĩ của mình đã xem xét vấn đề
đưa vào ngay từ bậc trung học cơ sở các tình huống ngẫu nhiên, trong đó có sự tác
động của mô hình hóa và giả lập với phần mềm Cabri-géomètre 2.
- Brousseau G., Brousseau N. & Warfield G (2002) đã nghiên cứu một tình huống
cơ sở để đưa vào khái niệm XS ở trường phổ thông, trong đó có tính đến yếu tố
ngẫu nhiên.
7
- Briand J. (2005), nghiên cứu một tình huống tiếp cận các luật ngẫu nhiên ở bậc
trung học phổ thông. Tình huống đó giúp người học nhận ra những yếu tố thiết lập
nên quan hệ giữa XS với TK.
- Wozniak F. (2005), với luận án tiến sĩ "Conditions et contraintes de
l’enseignement de la statistique en classe de seconde générale. Une repérage
didactique" nghiên cứu việc DH TK ở lớp đầu cấp trung học cơ sở của Pháp. Thừa
nhận rằng đào tạo tư duy TK là một vấn đề mấu chốt, tác giả xem xét những điều
kiện và những ràng buộc mà người giáo viên phải chịu trong thực hành DH các nội
dung của TK. Câu hỏi mà tác giả đặt ra để nghiên cứu là "tại sao các điều kiện, các
ràng buộc rất khác nhau trong nhiều thể chế mà thực tế DH thì hầu như đều thiên về
việc rút gọn TK vào các tính toán số học ?".
- Chevallard Y. và Wozniak F. cũng có một số bài báo tập trung vào chủ đề DH XS-
TK ở bậc trung học, chẳng hạn như Enseigner la statistique au secondaire, entre
genre prochaine et différence spécifique(2005), Enseigner la statistique en seconde:
un problème de la profession (2006), ...
- Artaud M. (1993) với luận án tiến sĩ "La mathématisation en économie comme
problème didactique - Une étude exploratoire" đã thực hiện một phân tích lịch sử
toán học và kinh tế học để chỉ ra rằng việc tạo ra các tri thức kinh tế thường gắn liền
với những cuộc điều tra toán học (được thực hiện một cách thỏa đáng), sau đó là
truyền bá các kết quả điều tra, và công việc thứ hai này không phải là đơn giản.
Nghiên cứu đó cho thấy quan hệ mật thiết giữa kinh tế học với toán học, đặc biệt là
với lý thuyết XS-TK. Từ ghi nhận này, tác giả xem xét lại công tác đào tạo ở các trường đại học kinh tế ở Pháp, xét từ góc nhìn của lý thuyết Chuyển hóa sư phạm1.
Susan Miles (2010) với bài báo "Statistics teaching in medical school:
Opinions of practising doctors", đã điều tra quan điểm của bác sĩ lâm sàng và cho ta
1 Đây là một lý thuyết được nhà nghiên cứu người Pháp Y. Chevalard đặt nền móng từ những năm 80 của thế kỷ trước, và hiện nay đã được thừa nhận, được phát triển rộng rãi trên thế giới. Trong chương 1 của luận án chúng tôi sẽ giới thiệu một vài khái niệm cơ bản của lý thuyết này.
thấy có rất ít bác sĩ sử dụng được những kiến thức và kĩ năng TK mà họ đã được
8
học ở bậc đại học. Hơn nữa, nhu cầu đào tạo TK cho bác sĩ đã thay đổi do những
tiến bộ trong công nghệ thông tin và sự gia tăng tầm quan trọng của phương pháp y
học dựa trên chứng cứ. Từ đó tác giả khuyến cáo phải cải tiến phương pháp giảng
dạy cho tương lai.
Đại bộ phận các công trình trên đều bàn về chủ đề DH XS-TK ở bậc trung
học. Đối với bậc đại học, công trình của Artigue M. nhấn mạnh việc thiết lập quan
hệ giữa XS với TK trong đào tạo ngành kinh tế, còn nghiên cứu của Susan Miles
cũng chỉ mới là một điều tra thực tiễn để làm rõ nhu cầu phải thay đổi phương pháp
DH XS-TK ở các đại học Y.
Ngoài hai công trình của Artaud M. và Susan Miles, chúng tôi được biết có dự
án LOE bắt đầu được triển khai ở Đại học Joseph Fourier của Cộng hòa Pháp từ
năm 2011. Mục đích của dự án là thiết kế một trang web dùng cho việc đào tạo ở
trường Đại học Y (thuộc Đại học Joseph Fourier), nhằm hình thành ở SV năng lực
thực hiện một nghiên cứu y học (từ bước xác định vấn đề nghiên cứu, xây dựng
phương pháp nghiên cứu, đến thu thập DL, phân tích DL, rồi viết bài báo khoa học)
và năng lực đọc có phê phán một bài báo của y học. Với tư cách là thành viên của
dự án, vừa qua, trong Hội thảo quốc tế về Didactic Toán tổ chức tại Đại học Sư
phạm Tp HCM, hai nhà nghiên cứu NEY M. và Bessot A. đã trình bày một phân
tích so sánh hai cuốn giáo trình XS-TK được sử dụng ở Đại học Y Dược Tp HCM
và Đại học Joseph Fourier. Xin được nói rõ rằng chúng tôi cũng là thành viên
nghiên cứu tham gia dự án này.
• Một số công trình của tác giả Việt Nam
Nếu như nhiều nước trên thế giới đã đưa XS-TK vào dạy cho học sinh phổ
thông từ ít nhất là vài chục năm nay, thì ở Việt Nam lần đầu tiên, kể từ năm học
2006 -2007, mảng kiến thức này mới được đề cập một cách tương đối có hệ thống
trong chương trình môn toán giảng dạy đại trà bậc trung học phổ thông. Chính vì
thế mà DH XS-TK trở thành một chủ đề được một số nhà nghiên cứu quan tâm.
Đã có nhiều công trình nghiên cứu của các tác giả Việt Nam bàn về chủ đề DH
XS-TK ở trường phổ thông như Trần Kiều (1988), Đỗ Mạnh Hùng (1993), Vũ Như
9
Thư Hương (2011), Trần Túy An (2007), Lê Thị Hoài Châu (2010a, 2010b, 2012,
2013), Trần Lương Công Khanh (2013), Nguyễn Thị Tân An (2013).
Trần Kiều (1988) nghiên cứu nội dung và phương pháp dạy TK mô tả trong
chương trình toán cải cách ở trường phổ thông cơ sở Việt Nam, xác định những
hình thức tổ chức giảng dạy thích hợp với thực tiễn và DH toán ở Việt Nam.
Đỗ Mạnh Hùng (1993) đã tổng kết kinh nghiệm nghiên cứu của các nhà sư
phạm trong và ngoài nước về giáo dục TK toán và lý thuyết XS ở trường phổ thông,
phương án về nội dung và phương pháp DH “một số yếu tố của lý thuyết XS” cho
HS chuyên toán bậc phổ thông trung học Việt Nam.
Vũ Như Thư Hương (2011) nghiên cứu việc DH TK ở lớp đầu cấp trung học
phổ thông nhằm mục đích giúp học sinh nhìn thấy một số yếu tố cho phép thiết lập
quan hệ giữa XS và TK, thấy được ảnh hưởng của việc chọn mẫu. Phân tích chương
trình, sách giáo khoa toán lớp 10, lớp 11 của tác giả cho thấy việc DH XS và TK ở
Việt Nam hoàn toàn tách rời nhau. Từ phân tích tri thức luận, tác giả đã chỉ ra ba bài
toán ứng viên cho việc thiết lập quan hệ này, rồi lấy một trong ba bài toán đó làm cơ
sở để thiết kế một đồ án DH.
Trần Túy An nghiên cứu thực hành giảng dạy khái niệm XS. Nghiên cứu này cho thấy dù ý đồ DH của thể chế2 song ngữ Pháp-Việt và thể chế DH đại trà của
Việt Nam có nhiều điểm khác nhau, GV trong cả hai thể chế đều chỉ thu gọn khái
niệm XS vào định nghĩa cổ điển.
Nguyễn Thị Tân An thiên về vấn đề mô hình hóa trong DH học XS-TK ở
trường phổ thông. Còn tác giả Lê Thị Hoài Châu (2012) thì qua một chùm đề tài
nghiên cứu đã cố gắng làm rõ quan hệ giữa XS với TK, nghĩa của một số khái niệm
cơ bản, những chướng ngại, khó khăn của việc chiếm lĩnh một số khái niệm, … để
nhấn mạnh tầm quan trọng của mô hình hóa trong DH.
Liên quan đến bậc đại học có luận văn thạc sỹ của Tăng Minh Dũng (2010) và
2 Thuật ngữ « thể chế » sẽ được chúng tôi giải thích trong chương 2.
bài báo của Lê Thị Hoài Châu (2013). Tuy nhiên, đối tượng mà hai tác giả này quan
10
tâm là vấn đề đào tạo giáo viên toán về mảng XS-TK nói chung, về tri thức "biểu
đồ" nói riêng.
Ngoài ra, một số luận án tiến sĩ của các tác giả như Phạm Văn Trạo (2009), Tạ
Hữu Hiếu (2010), Phan Thị Tình (2011), Ngô Tất Hoạt (2011), Trần Thị Hoàng
Yến (2011), Hoàng Nam Hải (2013),… cũng đã tập trung vào vấn đề dạy học XS-
TK cho SV các trường cao đẳng và đại học.
Phạm Văn Trạo (2009) nghiên cứu vai trò, tác dụng, mục đích, nguyên tắc, nội
dung, cách thức biên soạn và chuẩn bị tổ chức các tiên đề chuẩn bị tiềm năng DH
XS-TK cho SV toán Đại học Sư phạm.
Tạ Hữu Hiếu (2010) tìm hiểu thực trạng DH môn TK toán học và việc vận
dụng phương pháp TK toán học trong nghiên cứu khoa học cho SV các trường Đại
học Thể dục Thể thao, đồng thời đề xuất một số biện pháp và thực nghiệm sư phạm
để kiểm tra tính khả thi của nó.
Phan Thị Tình (2011) đã trình bày cơ sở lí luận và thực tiễn đối với sự phát
triển của toán học và vấn đề giảng dạy toán cho SV, đề xuất các biện pháp tăng
cường vận dụng toán học vào thực tiễn trong DH môn XS-TK cho SV toán Đại học
Sư phạm.
Ngô Tất Hoạt (2011) đã nghiên cứu đặc điểm, thực tế của kiến thức XS-TK ở
Trường Đại học Sư phạm Kỹ thuật và đề xuất một số biện pháp nhằm bồi dưỡng
các thành tố năng lực kiến tạo kiến thức cho SV.
Với đề tài “Vận dụng DH theo dự án trong môn XS-TK” ở trường đại học
(chuyên ngành kinh tế kỹ thuật), tác giả Trần Thị Hoàng Yến (2011) đã trình bày cơ
sở lý luận và thực tiễn của DH theo dự án, đề xuất quy trình, cách tổ chức và xác
định các nội dung cụ thể khi DH theo dự án trong môn XS-TK.
Hoàng Nam Hải (2013) với đề tài “Phát triển năng lực suy luận TK cho SV
cao đẳng chuyên nghiệp” đã góp phần làm rõ nội hàm của khái niệm suy luận TK;
đề xuất 10 loại hình suy luận TK mà SV cao đẳng chuyên nghiệp thường sử dụng
khi tham gia vào một quá trình hoạt động TK.
11
Một cách tổng quan, chúng tôi thấy hầu hết các tác giả này đều đặt nghiên cứu
của mình vào việc DH XS-TK ở bậc trung học và đại học. Tuy nhiên, đối với bậc
đại học, đối tượng mà các tác giả quan tâm là vấn đề đào tạo giáo viên toán về mảng
XS-TK và việc nâng cao hiệu quả DH XS-TK cho SV các trường không thuộc
chuyên ngành y dược.
1.4. Định hướng nghiên cứu của chúng tôi
Những luận điểm trình bày ở phần 1.1, 1.2, 1.3 giải thích cho việc chúng tôi
chọn Dạy học Xác suất - Thống kê ở trường Đại học Y làm đề tài nghiên cứu. Hơn
nữa, ở cương vị một GV đại học y khoa, bản thân chúng tôi cũng có nhiều trăn trở
về vấn đề DH XS-TK trong tiến trình đào tạo các bác sĩ tương lai.
Rõ ràng là DH XS-TK cho SV y khoa không thể hoàn toàn giống như cho SV
của các trường đại học tổng hợp hay đại học sư phạm. Vấn đề cơ bản là phải đem
lại cho các bác sĩ tương lai những phương tiện để họ thấy được sự cần thiết của XS-
TK đối với y học, và có thể sử dụng XS-TK vào hoạt động nghề nghiệp của mình.
Trong khuôn khổ có hạn của luận án, chúng tôi giới hạn phạm vi nghiên cứu
vào đối tượng KĐ giả thuyết TK, một đối tượng cơ bản, có mặt hầu hết trong các
nghiên cứu y học. Ngoài ra, như chúng tôi sẽ chỉ ra trong luận án của mình, phân
phối chuẩn (PPC) của DL là một điều kiện quan trọng tác động vào bài toán KĐ giả
thuyết TK. Việc không tính đến điều kiện ấy thường dẫn đến những kết luận sai lầm
trong các nghiên cứu y học. Vì thế, liên quan đến bài toán KĐ giả thuyết TK chúng
tôi sẽ đặc biệt quan tâm đến đối tượng tri thức PPC.
Những câu hỏi ban đầu mà chúng tôi mong muốn tìm câu trả lời là: trong thực
tế, liên quan đến đối tượng tri thức KĐ giả thuyết TK nói chung, PPC nói riêng, SV
ngành Y được học gì ? Họ có thể sử dụng các tri thức đó ra sao ? Những sai lầm nào
họ thường phạm phải khi sử dụng ? Hoạt động DH có thể tác động ra sao vào việc
giúp SV nhận ra những sai lầm đó để có thể sử dụng XS-TK vào hoạt động nghiên
cứu và hoạt động nghề nghiệp của họ sau này ?
12
2. LỰA CHỌN CÔNG CỤ LÝ THUYẾT
Chúng tôi đã chọn Didactic Toán (theo trường phái hình thành từ Pháp) với
các công cụ lí thuyết đặc trưng của nó, vì chúng cho phép cụ thể hóa và phát triển
các câu hỏi khởi đầu nêu trên và đặc biệt là tìm được câu trả lời thích đáng cho các
vấn đề đã đặt ra. Cụ thể hơn, chúng tôi sẽ vận dụng các khái niệm chuyển hóa sư
phạm, quan hệ thể chế, quan hệ cá nhân, tổ chức toán học, tổ chức didactic, hợp
đồng DH, môi trường và đồ án DH. Trong chương đầu (Cơ sở lý luận) của luận án
chúng tôi sẽ trình bày rõ các khái niệm này, qua đó giải thích vì sao việc lựa chọn
các công cụ lý thuyết ấy là phù hợp.
Thêm vào đó, chúng tôi còn phải sử dụng khái niệm tri thức luận và mô hình
hóa. Khái niệm tri thức luận cũng sẽ được chúng tôi làm rõ trong chương Cơ sở lý
luận. Mô hình hóa toán học là một công cụ được chúng tôi lựa chọn khi tìm cách cải
tiến thực tế đào tạo theo hướng đặt SV vào hoạt động trong một môi trường có tác
động phản hồi. Quan điểm học tập bằng hoạt động này phù hợp với xu hướng DH
tích cực được hình thành từ Thuyết kiến tạo đang được thừa nhận rộng rãi trên thế
giới. Tuy nhiên, khái niệm mô hình hóa sẽ chỉ được chúng tôi trình bày một cách
tóm lược trong chương Cơ sở lý luận, vì ba lý do. Thứ nhất, khái niệm này đã được
dùng khá phổ biến trong cộng đồng các nhà nghiên cứu và nhà sư phạm, ở ngoài
nước cũng như trong nước. Thứ hai, dù quy trình mô hình hóa luôn hiện diện trong
các tình huống mà chúng tôi thiết kế để DH, nó sẽ không được nhắc đến một cách
tường minh trong phân tích của chúng tôi, vì phân tích đó được thực hiện từ cách
tiếp cận của khái niệm đồ án DH. Lý do thứ ba, thứ yếu, là do số trang quy định
không nhiều cho các luận án.
3. MỤC TIÊU, PHƯƠNG PHÁP VÀ NỘI DUNG NGHIÊN CỨU
Trong khung lý thuyết đã lựa chọn, những câu hỏi khởi đầu của chúng tôi
được chi tiết hóa như sau:
- Đâu là những đặc trưng tri thức luận của KĐ giả thuyết TK ? Vai trò của PPC
trong KĐ giả thuyết TK là gì ?
13
- Đâu là những đặc trưng của quan hệ thể chế với đối tượng KĐ giả thuyết TK nói
chung, PPC nói riêng? Thể chế được chúng tôi xét đến ở đây là thể chế DH XS-TK
ở các trường đại học y khoa.
- Những ràng buộc của thể chế DH ảnh hưởng ra sao đến mối quan hệ cá nhân của
GV và SV đối với PPC và KĐ giả thuyết TK ?
- Trong DH XS-TK, định hướng nào có thể mang lại cho SV y khoa những phương
tiện giúp họ nhận ra sự cần thiết của XS-TK đối với Y học và biết sử dụng nó vào
hoạt động nghề nghiệp của mình ?
Như vậy, mục tiêu của luận án là làm rõ đặc trưng của đối tượng KĐ giả
thuyết TK nói chung, PPC nói riêng cả từ góc độ tri thức luận và sư phạm (trong thể
chế DH XS-TK ở trường Đại học Y Dược Tp HCM, nơi đào tạo nguồn nhân lực y
tế chủ yếu cho toàn bộ Miền Nam), khiếm khuyết trong lựa chọn của thể chế DH và
ảnh hưởng của những lựa chọn (do thể chế thực hiện) trên quan hệ cá nhân của GV
và SV về các đối tượng này, từ đó thiết kế một đồ án sư phạm có thể khắc phục
những khiếm khuyết của quan hệ thể chế ở phía SV.
Thêm vào đó, luận án cũng nhắm tới mục tiêu giới thiệu và minh chứng cho tính
hiệu quả của một số công cụ lí thuyết của Didactic Toán, nhằm làm phong phú hơn
kho tàng Lí luận và Phương pháp DH môn toán ở nước ta.
Để đạt được mục tiêu này, chúng tôi chọn phương pháp luận nghiên cứu như sau:
a) Thực hiện một tổng hợp tri thức luận về đối tượng KĐ giả thuyết TK và
PPC. Để thuận tiện trong trình bày, chúng tôi sẽ gọi đối tượng này là O.
Nghiên cứu tri thức luận sẽ mang lại một tham chiếu cho nghiên cứu thể
chế DH được thực hiện sau đó.
b) Nghiên cứu đặc trưng của các đối tượng tri thức O trong đào tạo cán bộ y
tế tại Đại học Y Dược Tp HCM. Nghiên cứu này được đặt trong phân tích
so sánh với thể chế DH khác - Đại học Y, thuộc Đại học Joseph Fourier –
Cộng hòa Pháp và Đại học Y, thuộc Đại học Nam Illinois (Southern Illinois
University), Hoa Kỳ. Việc đặt trong quan điểm so sánh sẽ cho phép làm rõ
hơn những đặc trưng của quan hệ thể chế chủ yếu mà chúng tôi quan tâm.
14
Phân tích quan hệ thể chế sẽ cho phép chúng tôi dự đoán ảnh hưởng của nó
lên quan hệ cá nhân của GV và SV Y khoa.
c) Nghiên cứu thực nghiệm, tìm hiểu sai lầm của SV khi đứng trước bài toán,
nhằm hợp thức hóa (hay không) những giả thuyết về ảnh hưởng của quan hệ
thể chế lên quan hệ cá nhân của SV. Tuy nhiên, bởi vì mỗi cá nhân có thể
đã, đang tồn tại trong nhiều thể chế khác nhau, chúng tôi sẽ tiến hành một
nghiên cứu quan sát giờ dạy của GV với mục đích tìm hiểu xem thực hành
DH của GV đó có làm giảm bớt đi không, hay ngược lại, củng cố thêm
những khó khăn, sai lầm của SV.
d) Từ các kết quả nghiên cứu trên đề xuất các giải pháp sư phạm và triển khai
thực nghiệm một đồ án DH KĐ giả thuyết TK nhằm kiểm chứng một số
giải pháp đã đề ra.
Tổ chức các nghiên cứu như trên được hình thành trên cơ sở lý luận mà trước
hết chúng tôi cần làm rõ. Ngoài ra, do tính chất mới mẻ của đề tài, chúng tôi cho
rằng việc tìm hiểu vai trò của XS-TK trong y học là cần thiết. Chính từ việc làm rõ
vai trò này, chúng tôi sẽ thực hiện một nghiên cứu bước đầu về những sai lầm
thường gặp (liên quan đến việc sử dụng XS-TK) trong các công trình nghiên cứu y
học và về thực tiễn DH. Các nghiên cứu này một mặt củng cố thêm tính cấp thiết và
ý nghĩa thực tiễn của đề tài, mặt khác cho chúng tôi một cái nhìn tổng quan về thực
tiễn DH XS-TK trong đào tạo cán bộ ngành Y.
Chúng tôi dùng sơ đồ 1 để mô tả mục tiêu và phương pháp luận nghiên cứu đã
lựa chọn.
15
Sơ đồ 1. Mục tiêu và phương pháp luận của luận án
Với mục tiêu và phương pháp luận nghiên cứu đã nêu, chúng tôi xác định nội
dung nghiên cứu của luận án như sau:
• Phân tích và tổng hợp những yếu tố lí thuyết chủ yếu của Didactic Toán để
hình thành cơ sở lí luận cho các nghiên cứu thực hiện trong khuôn khổ luận án.
• Tìm hiểu vai trò của XS-TK trong y học và thực hiện một nghiên cứu khởi
đầu về thực tiễn. Nghiên cứu này được trải ra trên hai phương diện:
- Tìm hiểu những sai lầm thường gặp về việc sử dụng XS-TK trong các công
trình nghiên cứu y học ở Việt Nam
- Quan sát thực hành giảng dạy XS-TK ở Đại học Y Dược Tp HCM.
• Nghiên cứu các đặc trưng tri thức luận của đối tượng O thông qua việc phân
tích lịch sử hình thành và phát triển của O.
16
• Phân tích quan hệ của thể chế (đặt trong quan điểm so sánh) để qua đó làm rõ
"cuộc sống" của O trong DH XS-TK ở Đại học Y Dược Tp HCM.
• Xây dựng và triển khai thực nghiệm tìm hiểu sai lầm của SV khi làm việc với
O, qua đó kiểm chứng giả thuyết về ảnh hưởng của quan hệ thể chế. Việc tìm nguồn
gốc sai lầm còn được thực hiện qua quan sát và phân tích giờ dạy của GV.
• Đề xuất một số giải pháp sư phạm góp phần nâng cao chất lượng DH XS-TK
trong các trường Đại học Y, Dược.
• Thiết kế một đồ án DH và triển khai theo định hướng các giải pháp đã đề nghị,
đồng thời khắc phục những khiếm khuyết của quan hệ cá nhân SV đối với các đối
tượng O.
4. GIẢ THUYẾT KHOA HỌC
Theo cách tiếp cận của Didactic Toán, giả thuyết khoa học không nảy sinh
ngay từ lúc khởi đầu, mà chỉ có thể được hình thành từ những nghiên cứu tri thức
luận và sư phạm. Như chương 3 và chương 4 của luận án sẽ chỉ ra, các nghiên cứu
đó cho phép chúng tôi nêu lên hai giả thuyết khoa học sau:
Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép
giải thích sai lầm của SV:
R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so
sánh hai trung bình thực nghiệm độc lập.
R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung
bình thực nghiệm độc lập.
Giả thuyết 2: SV có thể nhận ra sai lầm của mình thông qua hoạt động giải
quyết các tình huống phá vỡ hợp đồng, được thiết kế theo quan điểm của phương
pháp DH tích cực, trong đó yếu tố môi trường cho phép họ bác bỏ sự vận dụng một
kỹ thuật ở ngoài phạm vi hợp thức của nó.
5. NHỮNG LUẬN ĐIỂM CẦN BẢO VỆ
- Một số kết quả thu được từ bước đầu nghiên cứu thực tiễn sử dụng và DH
XS-TK.
- Đặc trưng tri thức luận của KĐ giả thuyết TK nói chung, của PPC nói riêng.
17
- Đặc trưng thể chế của KĐ giả thuyết TK và PPC
- Những sai lầm gắn với KĐ giả thuyết TK thường gặp ở SV và nguồn gốc
của chúng.
- Một số biện pháp nhằm cải tiến chất lượng đào tạo về XS – TK ở đại học Y –
Dược. Đồ án DH và thực nghiệm kiểm chứng.
6. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
• Luận án giới thiệu một số công cụ lí thuyết của Didactic Toán, trong sự kết
nối với quan điểm DH tích cực, làm phong phú thêm kho tàng Lý luận và Phương
pháp DH môn Toán ở nước ta.
• Về mặt phương pháp luận, luận án củng cố thêm lợi ích của cách tiếp cận đối
tượng tri thức đã được một vài công trình nghiên cứu công bố gần đây. Cách tiếp
cận này có một số điểm khác so với tiếp cận từ quan điểm của Lí luận và phương
pháp DH toán thường được áp dụng trong nước. Đặc biệt, đó là việc vận dụng phép
biện chứng giữa nghiên cứu tri thức luận với nghiên cứu thể chế và phương pháp
hợp thức hóa nội tại (thay vì cách hợp thức hóa ngoại vi).
• Luận án đã góp phần làm rõ các yếu tố thuộc đặc trưng tri thức luận và thể
chế của một đối tượng tri thức quan trọng luôn hiện diện trong hoạt động nghề
nghiệp và nghiên cứu của các bác sĩ – KĐ giả thuyết TK. Qua đó, luận án cũng đã
chỉ ra ảnh hưởng của sự lựa chọn của thể chế đến hiệu quả đào tạo về XS-TK cho
cán bộ y tế.
• Cuối cùng, luận án đã kiểm chứng tính khả thi và hiệu quả của một đồ án
DH KĐ giả thuyết TK từ quan điểm DH tích cực.
Với những đóng góp trên, chúng tôi hy vọng rằng luận án sẽ là một tài liệu
tham khảo hữu ích cho các nhà lập chương trình đào tạo ngành Y, các tác giả viết
giáo trình XS-TK cho SV Y khoa và cho GV, góp phần nâng cao chất lượng đào tạo
cán bộ y tế.
18
7. CẤU TRÚC LUẬN ÁN
Với những nội dung nghiên cứu đã xác định, luận án được tổ chức trong 6
chương như sau:
- Chương 1: Cơ sở lý luận
- Chương 2: Xác suất thống kê và y học: Từ toán học đến những nghiên cứu
thực tiễn đầu tiên
- Chương 3: Kiểm định giả thuyết thống kê và phân phối chuẩn: một phân tích
tri thức luận
- Chương 4: Kiểm định giả thuyết thống kê và phân phối chuẩn: một nghiên
cứu thể chế
- Chương 5: Nghiên cứu thực hành dạy học của giảng viên và quan hệ cá nhân
của sinh viên với đối tượng O
Chương 6: Các giải pháp sư phạm và nghiên cứu thực nghiệm.
19
CHƯƠNG 1
CƠ SỞ LÝ LUẬN
Chương này dành cho việc trình bày những yếu tố cơ bản nhất làm cơ sở lí
luận cho toàn bộ các nghiên cứu được thực hiện trong luận án. Các phân tích trong
chương được tham khảo từ những tài liệu sau: Chevallard Y. (1985, 1991), Artigue
M. (1992), Brousseau G. (1998), Comiti C. (2004), Đặng Vũ Hoạt (2004), Nguyễn
Bá Kim (2005), Lê Thị Hoài Châu (2001, 2002, 2006, 2011), Nguyễn Phú Lộc
(2007), Lê Văn Tiến (2005), Bessot A. và các tác giả (2009).
1.1. DIDACTIC TOÁN
Didactic Toán, xét với tư cách một khoa học, có thể được dịch là Lý luận và
Phương pháp DH Toán. Tuy nhiên, các nhà nghiên cứu Việt Nam đã không dịch
thuật ngữ này vì muốn nhấn mạnh rằng nó không hoàn toàn đồng nhất với trường
phái Lý luận và Phương pháp DH môn Toán đã phát triển từ lâu ở Việt Nam.
Đối tượng nghiên cứu của Didactic Toán
Giống như Lý luận và Phương pháp DH, Didactic một môn học nghiên cứu
các quá trình truyền thụ và lĩnh hội những nội dung và phương pháp khác nhau của
môn học đó, đặc biệt là trong hoàn cảnh trường học. Didactic Toán có đối tượng
nghiên cứu là các hoạt động DH toán, và cũng nhắm đến mục đích cải tiến thực tiễn
giáo dục. Tuy nhiên, Didactic Toán đặc biệt quan tâm đến việc xây dựng tri thức
Mục đích đầu tiên của Didactic Toán là làm sáng tỏ những điều kiện và những ràng
buộc trong đó việc dạy và học toán được thực hiện. […]
Để nghiên cứu các tình huống xây dựng và hoạt động của kiến thức trong toán học,
các nhà nghiên cứu didactic đặc biệt tính đến:
- những nét đặc thù của tri thức toán học đang bàn đến,
- những đặc trưng và ràng buộc của thể chế dạy học,
- tính phức tạp của tình huống dạy học,
- thực hành dạy học của thầy giáo
- kiến thức ban đầu của học sinh
toán học, đến những điều kiện của việc học tập các kiến thức trong môn Toán.
20
- quá trình tác động qua lại giữa thầy giáo, học sinh và đối tượng kiến thức đưa ra
giảng dạy, trong một tình huống dạy học. (Bessot A. và tgk, 2009, tr. 26)
Với đối tượng nghiên cứu xác định như thế, hệ thống tối tiểu mà Didactic xem
xét được biểu diễn qua sơ đồ gồm bốn yếu tố Thầy giáo, Học trò, Tri thức, Môi
trường (Sơ đồ 1.1).
Sơ đồ 1.1. Hệ thống tối tiểu cần nghiên cứu
Tri thức luôn luôn là yếu tố đầu tiên cần nghiên cứu: không có tình huống dạy
một khái niệm, một định lý chung chung, mà là dạy khái niệm gì, tính chất nào.
Giữa ba yếu tố Thầy giáo, Học trò, Tri thức luôn tồn tại những mối quan hệ
mà để nghiên cứu chúng thì Didactic đã xây dựng nên các công cụ lý thuyết đặc thù
của mình.
Phương pháp nghiên cứu của Didactic Toán
Phương pháp nghiên cứu của Didactic Toán có hai đặc trưng:
- Có những công cụ riêng để mô hình hóa các thành phần của đối tượng
nghiên cứu và mối quan hệ giữa chúng.
- Sử dụng hình thức hợp thức hóa nội tại (chứ không phải là hợp thức hóa
ngoại vi) để chứng tỏ tính thỏa đáng của kết quả nghiên cứu.
1.1.1. Tổng quan về các công cụ lý thuyết đặc trưng của Didactic Toán
Didactic cũng được xây dựng trên cơ sở một số khoa học khác như Tâm lý
học, Giáo dục học, Triết học, … Nhưng thêm vào đó, Didactic tự xây dựng cho
mình những công cụ lý thuyết riêng để mô hình hóa các nhân tố Thầy giáo – Học
trò – Tri thức và mối quan hệ giữa các yếu tố này.
21
Tri thức cần phải dạy đã được quy định bởi chương trình và các văn bản chính
thức. Nó khác với tri thức bác học (là tri thức được cộng đồng các nhà toán học thừa
nhận), vì đã bị biến đổi để có thể dạy được. Didactic có khái niệm chuyển hóa sư
phạm để nghiên cứu những giai đoạn khác nhau của sự biến đổi này, và khái niệm
quan hệ của thể chế đối với tri thức để xem xét sự tồn tại của tri thức trong thể chế.
Những biểu tượng mà thầy giáo có về tri thức phải dạy sẽ đóng một vai trò
quan trọng trong việc lựa chọn cách thức tổ chức mà thầy giáo sẽ làm để tạo ra sự
học tập mong muốn. Những biểu tượng mà HS có về tri thức đó lại chi phối ứng xử
của HS khi làm việc với tri thức. Didactic dùng khái niệm quan hệ cá nhân với đối
tượng tri thức để mô hình hóa kiến thức mà thầy giáo hay HS có về tri thức. Ngoài
ra, kiến thức của HS còn được mô hình hóa bởi khái niệm trường quan niệm.
Khái niệm hợp đồng DH thì được các nhà nghiên cứu didactic xây dựng để mô
hình hóa mối quan hệ Thầy giáo – Học trò – Tri thức. Hợp đồng DH tính đến điều
mà thầy giáo chờ đợi ở HS và điều mà HS chờ đợi ở thầy giáo về một nội dung tri
thức xác định.
Nhằm trả lời cho câu hỏi thầy giáo làm thế nào để xây dựng và tổ chức một
môi trường cho phép nảy sinh ở HS sự thích nghi mong muốn dẫn tới sự hình thành
kiến thức, Didactic có Lý thuyết tình huống.
Như đã nói trong phần Mở đầu, một số trong những công cụ đặc thù của
Didactic Toán sẽ được chúng tôi sử dụng để tiến hành các nghiên cứu thực hiện
trong luận án. Những công cụ này sẽ được giới thiệu có hệ thống hơn ở các
phần sau.
1.1.2. Hợp thức hóa ngoại vi và hợp thức hóa nội tại
Giống như Lý luận và Phương pháp DH, Didactic là một khoa học thực
nghiệm. Cụ thể, những giả thuyết mà nhà nghiên cứu đặt ra sẽ được kiểm chứng
Một trong những đặc trưng của phương pháp nghiên cứu trong didactic là nhờ đến
thực nghiệm, hay nói chính xác hơn là sự vận hành trên hai phương diện – lý thuyết
hoá (lập một hệ thống câu hỏi trong khung tham chiếu) và kiểm chứng bằng thực
nhờ vào thực nghiệm.
22
nghiệm (nghiên cứu tính hợp thức bằng một thực nghiệm cho phép đối chiếu với thực
tiễn). (Bessot A. và tgk, 2009, tr. 25)
Nhưng cách hợp thức hóa (hay kiểm chứng) giả thuyết trong Lý luận và
Phương pháp DH và trong Didactic lại hoàn toàn khác nhau: nếu như lý thuyết thứ
nhất chọn cách hợp thức hóa ngoại vi (validation externe) thì Didactic Toán dùng
hợp thức hóa nội tại (validation interne). • Hợp thức hóa ngoại vi3
Giả thuyết nghiên cứu trong các công trình thuộc chuyên ngành Lý luận và
Phương pháp DH toán thường là giả thuyết về tính khả thi hay hiệu quả của một hệ
thống các giải pháp về DH toán mà nhà nghiên cứu đề xuất. Để kiểm chứng tính
khả thi hay hiệu quả đó, người ta thường tiến hành thực nghiệm triển khai các giải
pháp trên một nhóm đối tượng mẫu, sau đó đánh giá kết quả thực nghiệm so với
một nhóm đối tượng khác (gọi là nhóm đối chứng). Về cơ bản, hai nhóm đối tượng
này có bản chất như nhau, cái khác duy nhất là: trong nhóm đối chứng người ta
không vận dụng các giải pháp mà nhà nghiên cứu đề xuất như trong nhóm thực
nghiệm.
Công cụ đánh giá so sánh hiệu quả của hệ thống giải pháp thường là:
- Kết quả (bằng điểm số) của bài thi, kiểm tra,… được triển khai cả trong
hai nhóm.
- Ý kiến đánh giá của chuyên gia: đánh giá trực tiếp kế hoạch và nội dung các
giải pháp đã đề nghị, hoặc đánh giá qua kết quả triển khai thực hiện trên nhóm
đối tượng thực nghiệm nếu chuyên gia có quan sát việc triển khai thực nghiệm
(như dự giờ lên lớp, phỏng vấn HS,…).
Hợp thức hóa ngoại vi là một phương cách được sử dụng khá phổ biến và
mang lại những hiệu quả nhất định. Tuy nhiên, nó cũng thể hiện một số
3 Về khái niệm này, chúng tôi sử dụng lại phần trình bày của Trần Anh Dũng (2012).
khiếm khuyết.
23
Khiếm khuyết lớn nhất nằm ở việc so sánh kết quả bằng điểm số. Vì bản thân
độ tin cậy của kết quả so sánh điểm số giữa hai nhóm (nhóm thực nghiệm và nhóm
đối chứng) và cả độ tin cậy của điểm số (ngay cả trong nội bộ một nhóm) phụ thuộc
rất nhiều yếu tố, trong đó có nhiều yếu tố vượt ra khỏi phạm vi các giải pháp mà
nhà nghiên cứu đề xuất. Và như vậy, khó có thể đặt niềm tin hoàn toàn vào tính khả
thi của giải pháp hay tính hợp thức của giả thuyết nghiên cứu.
Mặt khác, để gia tăng độ tin cậy của kết quả so sánh, cần phải tiến hành thực
nghiệm trên các tập hợp mẫu khá lớn: tập đối tượng của nhóm thực nghiệm và
nhóm đối chứng.
• Hợp thức hóa nội tại
Cách thức hợp thức hóa một giả thuyết trong Dicdactic Toán là hợp thức hóa
nội tại. Trong hợp thức hóa nội tại, người ta chỉ triển khai thực nghiệm trên nhóm
đối tượng mẫu, và do đó không có sự so sánh kết quả với nhóm đối chứng như
trong hợp thức hóa ngoại vi. Mấu chốt của hợp thức nội tại là thực hiện sự đối
chứng giữa phân tích tiên nghiệm (analyse a-priori) và phân tích hậu nghiệm
(analyse posteriori).
Phân tích tiên nghiệm
Có nhiều biến can thiệp vào quá trình thiết kế một tình huống thực nghiệm.
Các biến này thường hoạt động theo các phương thức phức tạp đòi hỏi nhà nghiên
cứu phải thực hiện một sự mô hình hóa sơ bộ dựa trên một khung quy chiếu đã
được lựa chọn. Chính trong khung quy chiếu này, nhà nghiên cứu thực hiện một
Một trong những vai trò chủ yếu của phân tích tiên nghiệm là xác định những cái có
thể quan sát được mà thông qua đó hoạt động của hệ thống được thể hiện. Những cái
quan sát được này là đích đáng đối với đối tượng nghiên cứu và ta cần giải thích một
cách hợp lý hoạt động của hệ thống trong khung qui chiếu đã chọn.
(Bessot A. và tgk, 2009, tr. 134)
phân tích tiên nghiệm độc lập với các diễn tiến của thực nghiệm.
Khi phân tích tiên nghiệm, nhà nghiên cứu cần:
- tìm ra những kiến thức chỉ đạo việc thực hiện các chiến lược khác nhau mà
người ta có thể dự kiến được;
24
- nếu có thể thì đánh giá lợi ích cũng như tốn kém của những chiến lược khác
nhau đó;
Để tiến hành phân tích tiên nghiệm và xác định các chiến lược có thể có, nhất thiết
phải:
- phân tích trên phương diện toán học về tri thức đem ra giảng dạy trong tình huống và
về chính tình huống toán học có liên quan;
- xác định môi trường và những tác động phản hồi của nó;
- phân tích chương trình (đôi khi cả sách giáo khoa) để có thể hình thành các giả
thuyết về kiến thức của học sinh và về cách học sinh có thể dùng để giải thích
tình huống; (Bessot A. và tgk, 2009, tr. 145)
- xác định được chiến lược tối ưu và kiến thức tương ứng với chiến lược ấy.
Trong trường hợp thực nghiệm triển khai một đồ án DH, có thể còn phải tính
đến nghiên cứu trước đó về quan niệm, khó khăn và chướng ngại liên quan đến tri
thức cần dạy của HS hay GV.
Qua phân tích tiên nghiệm, nhà nghiên cứu có thể điều chỉnh các biến để tìm
hiểu kiến thức của HS hoặc để nhận được ứng xử mong muốn xuất hiện ở họ.
Phân tích hậu nghiệm:
Phân tích hậu nghiệm là xem xét mối quan hệ giữa những dữ kiện thu được
trong diễn biến của một tình huống riêng biệt, đồng thời đánh giá và so sánh những
gì quan sát được với các kết quả đã dự kiến trong phân tích tiên nghiệm. Việc đối
chiếu dữ kiện quan sát được với phân tích tiên nghiệm cho phép nhà nghiên cứu xử
lý, giải thích những cái được quan sát và trình bày kết quả muốn nghiên cứu qua
thực nghiệm.
Đặc biệt, phân tích hậu nghiệm phải vạch ra những lựa chọn mà HS đã thực
hiện trong tình huống. Những lựa chọn này sẽ được giải thích như là kiến thức thực
thụ của HS và nghĩa của những câu trả lời của họ. Chính điều đó cho phép hợp thức
(hay không) giả thuyết mà nhà nghiên cứu đặt ra.
Khi phân tích hậu nghiệm nhà nghiên cứu không chỉ quan tâm đến những gì
đã dự kiến, mà còn cần phải đặt câu hỏi về những cái không được dự kiến trước
nhưng đã xẩy ra. Điều này khiến nhà nghiên cứu phải nhìn lại phân tích tiên
25
nghiệm: có những sự kiện với XS xuất hiện thấp đôi khi cho phép phát hiện những
tình huống bị bỏ sót trong lần phân tích tiên nghiệm đầu tiên. Nó cũng cho phép nhà
nghiên cứu thay đổi giá trị của biến để điều chỉnh tình huống đã xây dựng.
Như vậy, phân tích tiên nghiệm không nhất thiết là chỉ thực hiện trước thực
nghiệm: nhà nghiên cứu có thể phải trở đi trở lại xem xét sản phẩm của HS, đối
chiếu nhiều lần giữa những cái có thể quan sát (xác định trong phân tích tiên
nghiệm lần trước) với những cái đã quan sát được (vì có những chiến lược khó dự
kiến trước, hay vì có một số dữ kiện tìm thấy qua quan sát không thể được giải thích
ngay qua lần phân tích tiên nghiệm đầu tiên).
1.2. YẾU TỐ MÔI TRƯỜNG TRONG DIDACTIC TOÁN
Môi trường (milieu) trong Didactic được hiểu là sự mô hình hóa một bộ phận
của hoàn cảnh xung quanh chủ thể trong việc học tập được nhắm đến.
Yếu tố môi trường được tính đến vì Didactic cũng thừa nhận quan điểm của
Thuyết kiến tạo, theo đó tri thức được tạo nên một cách tích cực bởi chủ thể nhận
thức (chứ không phải tiếp thu thụ động từ bên ngoài), và nhận thức là quá trình tổ
chức lại thế giới quan của mỗi người để thích nghi.
Theo quan điểm này, Didactic thừa nhận hai giả thuyết sau về việc học:
- Giả thuyết tâm lí (hypothèse pchsycologique):
Chủ thể học bằng cách tự thích nghi với một môi trường – nhân tố gây ra
những mâu thuẫn, khó khăn và mất cân bằng.
Sự thích nghi này được thực hiện qua các hoạt động đồng hoá và điều ứng.
- Giả thuyết sư phạm (hypothèse didactique):
Một môi trường (environnement) không có chủ ý DH (tức là không được cố ý
tổ chức để dạy một tri thức) không đủ để tạo ra cho chủ thể mọi kiến thức mà xã hội
muốn chủ thể đó lĩnh hội được. Thầy giáo phải xây dựng và tổ chức một môi trường
(milieu) cho phép nảy sinh ở HS những thích nghi mong muốn dẫn tới sự kiến tạo
nên tri thức.
Giữa chủ thể và môi trường có một sự tương tác. Điều này được mô tả qua Sơ
đồ 1.2. Didactic gọi thông tin cụ thể do môi trường cung cấp là tác động phản hồi
26
của môi trường. Thông tin đó được HS tiếp nhận như một sự đánh giá, tích cực hay
tiêu cực, đối với hành động của họ, và cho phép họ điều chỉnh hành động đó, chấp
nhận hoặc gạt bỏ một giả thuyết, chọn một trong nhiều cách giải, v.v…
Sơ đồ 1.2. Tác động phản hồi của môi trường
Môi trường (milieu) này có thể là môi trường vật chất, cũng có thể là môi
trường phi vật chất. Môi trường phi vật chất bao gồm những kiến thức cho phép
người học tự hợp thức hay loại bỏ những quy trình họ đã sử dụng trong quá trình
Môi trường có một vai trò trung tâm trong việc học với tư cách là nguyên nhân của
những sự thích nghi, và trong việc dạy với tư cách là yếu tố qui chiếu.
Một tình trạng kiến thức lúc đó sẽ được đặc trưng bằng trạng thái cân bằng của hệ
thống học sinh - môi trường, đặt dưới những ràng buộc đã xác định rõ ràng.
(Bessot A. và tgk, 2009, tr. 42)
giải quyết vấn đề.
Học chính là quá trình xây dựng một tình trạng cân bằng mới sau khi môi
trường bị xáo trộn hoặc có những ràng buộc tác động lên nó.
1.3. THUYẾT NHÂN HỌC TRONG DIDACTIC TOÁN
Thuyết nhân học (théoie anthroplogique) được Chevalard đề xuất năm 1989
và nhanh chóng trở thành một công cụ hiệu quả của Didactic Toán. Lý thuyết này
đã đưa ra những khái niệm cho phép mô hình hóa quá trình xây dựng một tri thức
và mô hình hóa kiến thức của một cá nhân về tri thức đó. Tư tưởng tổng quát của lý
thuyết là xem một đối tượng tri thức như một sinh vật sống: nó cũng sẽ trải qua
những giai đoạn nảy sinh, tồn tại, phát triển, mất đi và luôn có những mối ràng buộc
với các đối tượng khác.
Những nội dung chủ yếu của Thuyết nhân học là:
- chuyển hóa sư phạm,
27
- quan hệ thể chế và quan hệ cá nhân với một đối tượng tri thức,
- tổ chức toán học và tổ chức didactic.
Ba khái niệm cơ bản lý thuyết là Đối tượng (tri thức), Thể chế và Cá nhân.
Tri thức là kết quả của sự phản ánh thế giới khách quan thông qua hoạt động của chủ
thể nhận thức, là những kinh nghiệm của loài người tích lũy được trong quá trình đấu
tranh với tự nhiên, xã hội và hoạt động tư duy. Những kinh nghiệm đó được các thế hệ
nối tiếp nhau kế thừa một cách có phê phán, phát triển và không ngừng hoàn thiện trên
cơ sở khái quát hóa, hệ thống hóa thành những tri thức của nhân loại.
(Đặng Vũ Hoạt, 2004)
1.3.1. Tri thức và thể chế
Thể chế (institution) là một tập hợp cá thể trong đó có những quy tắc áp đặt
mà mọi thành viên đều phải tuân theo. Một thể chế được gọi là thể chế DH
(institution didactique) nếu tồn tại ít nhất hai vị trí chủ thể (vị trí người dạy, vị trí
người học) và một ý định DH.
Một trong những định đề đầu tiên được thừa nhận trong Thuyết nhân học là:
mỗi tri thức đều là tri thức của một thể chế, và một đối tượng tri thức có thể sống
Một tri thức không tồn tại “lơ lửng” trong một xã hội rỗng: mọi tri thức đều xuất hiện
ở một thời điểm nhất định, trong một xã hội nhất định, như là được cắm sâu vào một
hoặc nhiều thể chế. (Chevallard, 1989)
trong những thể chế khác nhau:
Để tồn tại trong một thể chế, tri thức phải tuân theo những điều kiện ràng buộc
nhất định của thể chế, dẫn đến chỗ phải bị biến đổi cho phù hợp với những ràng
buộc này.
1.3.2. Sự chuyển hóa sư phạm (transposition didactique)
Quá trình chuyển đổi tri thức từ thể chế này sang thể chế kia, trong đó thể chế
đích là thể chế DH, được gọi là quá trình chuyển hóa sư phạm. Đó là quá trình
chuyển hóa gồm ba mắt xích cơ bản (sơ đồ 1.3)
Sơ đồ 1.3. Sự chuyển hóa sư phạm giữa các cấp độ tri thức
28
• Mắt xích thứ nhất: hình thành tri thức bác học
Sự ra đời của một tri thức bác học thuộc mắt xích đầu tiên. Nó là kết quả của
những hoạt động khoa học gắn liền với lịch sử cá nhân của nhà nghiên cứu. Để giải
quyết một vấn đề toán học nào đó, các nhà toán học đã tìm ra những phương pháp,
những kiến thức mới. Sau đó, họ chọn trong số ấy những kiến thức đủ mới, đủ hay,
có thể thông báo cho cộng đồng khoa học. Quá trình khám phá ra một tri thức có thể
khá dài, khá phức tạp, nên để trình bày nó, các nhà toán học phải diễn đạt nó ở dạng
khái quát nhất có thể được, theo những quy tắc thông dụng đang lưu hành trong
cộng đồng khoa học mà không trình bày bài toán dẫn đến việc hình thành tri thức,
không nêu lại quá trình tìm tòi, phát minh của mình, bỏ qua những sai lầm, chướng
ngại gặp phải. Ta nói là nhà toán học đã thực hiện hoạt động phi hoàn cảnh hóa, phi
cá nhân hóa và phi thời gian hóa. Như thế, tri thức mà nhà nghiên cứu thông báo
cho cộng đồng khoa học đã bị biến đổi và việc biến đổi này cũng là một phần quan
trọng của hoạt động toán học. Hoạt động biến đổi tri thức này có mặt tích cực là làm
cho tri thức trở thành tri thức chung, có thể dễ dàng sử dụng và kiểm tra bởi bất kỳ
ai chứ không chỉ bởi các thành viên trong cộng đồng khoa học. Tuy nhiên, hoạt
động đó lại xóa đi lịch sử tìm tòi, khám phá của nhà nghiên cứu, che dấu bài toán
ban đầu là nguồn gốc nảy sinh tri thức, làm cho phát minh trở thành bí ẩn, đặc biệt
là đối với các thế hệ đời sau.
• Mắt xích thứ hai: hình thành tri thức cần dạy
Trong những tri thức toán học được tích lũy qua lịch sử, các nhà thiết kế
chương trình chọn ra một số vấn đề làm đối tượng DH. Để những tri thức này có thể
dạy được cho một bộ phận công chúng, tri thức lại tiếp tục bị biến đổi để phù hợp
với môi trường và hệ thống DH. Các tri thức này được mô tả chính thức trong
chương trình hoặc thể hiện trong sách giáo khoa.
Các nhà biên soạn sách giáo khoa phải trình bày lại những tri thức được chọn
để có thể dạy được cho một bộ phận công chúng xác định, phù hợp với thể chế DH,
đối tượng DH. Để tri thức được sắp xếp theo một một trình tự mà người học có thể
lĩnh hội được, trong một số trường hợp, tác giả phải viết lại các định nghĩa, các tính
29
chất, biến đổi các phép chứng minh, v.v…. Quá trình này có thể tạo ra một số đối
tượng mới. Hệ quả là sự xuất hiện một sự chênh lệch khá lớn giữa tri thức bác học
với tri thức quy định trong chương trình và thể hiện trong sách giáo khoa.
• Mắt xích thứ ba: hình thành tri thức được dạy
Khi tri thức cần dạy đã được xác định, thầy giáo lại phải dựa vào trình độ từng
đối tượng HS, cơ sở vật chất, phương tiện giảng dạy và phương pháp sư phạm của
mình, thầy giáo sẽ chuyển tải những hiểu biết của họ về tri thức đó đến HS sao cho
HS có thể hiểu được. Cách chuyển tải này đương nhiên cũng phụ thuộc vào quan
niệm, vào biểu tượng mà thầy giáo có về tri thức. Và như vậy chuyển hóa sư phạm
Thầy giáo nói chung không dạy nguyên dạng tri thức khoa học hay tri thức chương
trình mà phải chuyển hóa tri thức chương trình thành tri thức dạy học. Nắm vững tri
thức khoa học là một điều kiện cần nhưng chưa đủ để đảm bảo kết quả dạy học.
(Nguyễn Bá Kim, 2005)
tiếp tục xẩy ra trong hệ thống dạy-học.
Như thế, để có thể trở thành tri thức DH, tri thức bác học phải chịu một quá
trình biến đổi theo những ràng buộc của thể chế mà nó đến để sống trong đó. Quá
trình biến đổi này nhiều khi tạo ra một khoảng cách rất lớn giữa tri thức như nó vốn
tồn tại trong cộng đồng khoa học với tri thức trình bày trong sách giáo khoa.
1.3.3. Quan hệ thể chế và quan hệ cá nhân với một đối tượng tri thức
Phân tích trên cho thấy vì sao trong Didactic người ta lại cho rằng yếu tố đầu
tiên cần nghiên cứu không phải là thầy giáo hay HS mà là tri thức cần dạy.
Câu hỏi đặt ra là “tri thức tồn tại ra sao trong thể chế ?”. Khái niệm quan hệ
R(I, O) của thể chế I (rapport institutionnel) đối với tri thức O được Chevalard đưa
vào để mô hình hóa các yếu tố trả lời cho câu hỏi này. Theo Chevalard, quan hệ
R(I, O) cho biết O xuất hiện ở đâu, như thế nào, tồn tại ra sao, có vai trò gì, có mối
quan hệ nào với những đối tượng khác của I, ... Tương tự như vậy, O tồn tại đối với
cá nhân X nếu X biết về O. Quan hệ cá nhân của X đối với O được xem là tập hợp
những yếu tố tác động qua lại mà X có với O (cảm nhận về O, sử dụng O, nói
về O, … ).
30
Khi X hội nhập vào một thể chế DH I, quan hệ R(X, O) sẽ được thiết lập nếu
nó chưa tồn tại hoặc được điều chỉnh, bổ sung nếu nó đã tồn tại. Trong cách hiểu
này, việc học tập của HS về đối tượng tri thức O chính là quá trình thiết lập hay
điều chỉnh mối quan hệ cá nhân đối với O, còn việc dạy của GV thì nhắm tới làm
thay đổi quan hệ cá nhân của HS đối với O.
Hiển nhiên, trong trường hợp I là thể chế DH thì quan hệ R(I, O) luôn để lại
dấu ấn trên R(X, O) – dù X ở vị trí người dạy hay người học. Vì thế mà trong thể
chế này việc nghiên cứu R(X, O) phải gắn liền với việc làm rõ quan hệ R(I, O).
1.3.4. Tổ chức toán học: một công cụ phân tích quan hệ thể chế
Vấn đề là làm thế nào để xác định các yếu tố của R(I, O) ? Thuyết nhân học
trong Didactic Toán cung cấp cho ta một công cụ để làm việc này, đó là khái niệm
praxéologie.
Theo Chevallard, mọi hoạt động xã hội đều được hình thành từ việc giải quyết
một nhiệm vụ xác định t thuộc một kiểu T nào đó. Kiểu nhiệm vụ T được giải quyết
nhờ một kỹ thuật τ - được giải thích, hoặc được tạo ra bởi công nghệ θ. Đến lượt
mình, θ được hợp thức hóa bởi lý thuyết Θ. Lý thuyết Θ lại được giải thích bởi một
lý thuyết khác. Quá trình giải thích này có thể còn tiếp tục vớiΘ và sau đó nữa,
nhưng ít nhất thì với τ, θ, Θ ta đã giải quyết được kiểu nhiệm vụ T với những căn cứ
hợp thức (được một cộng đồng thừa nhận)
Một bộ gồm 4 thành phần [T, τ, θ, Θ] được gọi là một praxéologie. Thuật ngữ
praxéologie được cấu thành từ hai gốc Hy lạp praxis - nghĩa là “thực hành” và
logos - nghĩa là “lí do”, “lập luận”. Thuật ngữ đó nhấn mạnh cấu trúc gồm hai
khối của bộ bốn [T, τ, θ, Θ]: khối thực hành - kỹ thuật [T, τ] và khối công nghệ - lí
thuyết [θ,Θ].
Một praxéologie mà các thành phần đều mang bản chất toán học được gọi là
một praxéologie toán học hay một tổ chức toán học (organisation mathématique),
ký hiệu là OM.
Khái niệm tổ chức toán học mang lại một công cụ để xác định các yếu tố của
quan hệ của thể chế I với một đối tượng tri thức O: Thông qua phân tích chương trình
31
và sách giáo khoa, sách giáo viên, các văn bản chính thức được ban hành về việc DH
tri thức O, nhà nghiên cứu có thể trả lời được hàng loạt câu hỏi: Liên quan đến O,
trong I có những OM nào? Chúng được hình thành từ kiểu nhiệm vụ nào ? Những kĩ
thuật nào được xây dựng ? Kĩ thuật nào được ưu tiên sử dụng ?... Trong các OM đó,
O xuất hiện với tư cách là kỹ thuật để giải quyết kiểu nhiệm vụ nào ? hay nó cho
phép tạo ra kỹ thuật nào ? … Chính việc làm rõ các tổ chức toán học liên quan đến
O sẽ cho phép nhà nghiên cứu vạch rõ mối quan hệ R(I, O) của thể chế I đối với tri
thức O.
Trong trường hợp praxéologie là một OM, ta có thể nói ngay rằng khối công
nghệ - lí thuyết bao gồm những tri thức toán học. Tuy nhiên, một số công trình
“Việc sử dụng các praxéologie thường đi kèm với sự phát triển các yếu tố công nghệ
thực hành, được xây dựng và hợp thức hóa qua ảnh hưởng của hoạt động của các nhà
toán học.” (Castelat, 2012)
nghiên cứu ở Pháp xoay quanh vấn đề giải các bài toán đã chỉ ra rằng:
Theo quan điểm này, Castelat (2008) đề nghị đưa thêm các yếu tố thực hành vào mô hình praxéologie, bằng cách phân biệt thành phần thực hành θp của
θ
,T
th , Θθ τ , p
công nghệ.
Nếu như thành phần lý thuyết θth tạo thành từ những kết quả được hợp thức hóa nhờ một lý thuyết, thì θp lại được hợp thức qua kinh nghiệm và không theo hệ thống toán học4. Thành phần θp này có thể lúc đầu được một (hay một nhóm)
chuyên gia xây dựng, nhưng sau đó được thể chế hóa nhờ những quá trình làm việc
tập thể đã kéo các nhà thực hành vào giải quyết những nhiệm vụ thuộc kiểu T, sau
“nhu cầu mô hình hóa tri thức được tạo ra trong sử dụng và để sử dụng các tổ chức
toán học vào nghiên cứu toán học và dạy học. Sau đó thì mô hình đã tỏ ra đặc biệt phù
4 Chữ th trong ký hiệu θ th có nghĩa là lý thuyết (theorie), còn p trong θ p có nghĩa là thực hành (pratique).
đó được hợp pháp hóa trong xã hội. Mô hình được đề nghị như vậy xuất phát từ
32
hợp với việc nghiên cứu những hiệu quả do sự chuyển đổi tác động đến các tổ chức
toán học khi người ta muốn đưa chúng vào với tư cách là công cụ cho những lĩnh vực
ngoài toán học và ứng dụng nghề nghiệp.” (Castelat, 2012)
Mô hình do Castelat đề nghị sẽ rất phù hợp cho nghiên cứu của chúng tôi, vì
thể chế được chúng tôi xem xét là một thể chế sử dụng tri thức toán học, và việc sử
dụng như thế nào có thể sẽ được giải thích bởi những bởi những yếu tố công nghệ
ngoài toán học.
1.3.5. Tổ chức didactic: một công cụ phân tích thực hành DH của GV
1.3.5.1. Tổ chức didactic
Khi một OM cần dạy đã được xác định, vấn đề đặt ra là tổ chức việc DH như
thế nào. Ta đứng trước một kiểu nhiệm vụ DH, tức là giúp người học nghiên cứu
một OM xác định.
Một praxéologie mà kiểu nhiệm vụ cấu thành nên nó thuộc loại nghiên cứu
hay DH được gọi là tổ chức didactic (organisation didactique), kí hiệu là OD. Cụ
thể hơn, một tổ chức didactic là một câu trả lời cho câu hỏi “dạy (tức là tổ chức
nghiên cứu) một tổ chức toán học xác định như thế nào?”
Như vậy, nghiên cứu một tổ chức didactic chính là nghiên cứu cách thức mà
người ta tiến hành để truyền bá một tổ chức toán học trong lớp học.
Theo Chevallard, dù không phải là mọi tổ chức toán học đều được tổ chức tìm
hiểu theo một cách thức duy nhất, thì vẫn có những thời điểm mà tất cả các hoạt
động nghiên cứu đều phải trải qua. Ông cho rằng, một tình huống học tập nói chung
bao gồm 6 thời điểm.
• Thời điểm thứ nhất: là thời điểm gặp gỡ lần đầu tiên với tổ chức toán học
OM – được xác định là mục tiêu đặt ra cho việc học tập liên quan đến đối tượng O.
Sự gặp gỡ như vậy có thể xẩy ra theo nhiều cách khác nhau. Tuy nhiên, có
một cách gặp, hay “gặp lại”, hầu như không thể tránh khỏi, trừ khi người ta nghiên
cứu O rất hời hợt, là cách gặp thông qua một hay nhiều kiểu nhiệm vụ Ti cấu thành
nên O. Sự “gặp gỡ lần đầu tiên” với kiểu nhiệm vụ Ti có thể xẩy ra qua nhiều lần,
tùy vào môi trường toán học và môi trường sư phạm tạo ra sự gặp gỡ này: người ta
33
có thể khám phá lại một kiểu nhiệm vụ giống như khám phá lại một người mà
người ta nghĩ rằng mình đã biết rõ.
• Thời điểm thứ hai: là thời điểm nghiên cứu kiểu nhiệm vụ Ti được đặt ra, và
xây dựng nên một kỹ thuật τi cho phép giải quyết kiểu nhiệm vụ đó.
Vấn đề xây dựng kỹ thuật luôn luôn là trung tâm của hoạt động toán học.
Trong thực tế, việc tìm cách giải quyết một bài toán luôn luôn đi cùng với việc xây
dựng nên ít nhất một mầm mống để từ đó một kỹ thuật được hình thành.
Khi nghiên cứu người ta có thể đi theo nhiều con đường khác nhau, có thể gặp
phải những chướng ngại, có thể phải thay đổi quyết định, … Quá trình nghiên cứu
đó khơi thông ra một kỹ thuật ưu việt, sẽ được giữ lại để giải những bài toán
cùng loại.
Như thế, nghiên cứu một bài toán cá biệt, làm mẫu cho kiểu nhiệm vụ cần
nghiên cứu, là một cách thức tiến hành để triển khai việc xây dựng kỹ thuật tương
ứng. Kỹ thuật này sau đó sẽ lại là phương tiện để giải quyết mọi bài toán cùng kiểu.
• Thời điểm thứ ba: là thời điểm xây dựng môi trường công nghệ- lý thuyết
[θ, Θ] liên quan đến τi, nghĩa là tạo ra những yếu tố cho phép giải thích kỹ thuật đã
được thiết lập.
Thời điểm này có mối quan hệ chặt chẽ với các thời điểm khác. Lần gặp gỡ
đầu tiên với một kiểu nhiệm vụ thường được đặt trong mối liên hệ với môi trường
công nghệ - lý thuyết đã xây dựng từ trước, hay trong mối liên hệ với những mầm
mống của môi trường cần phải tạo ra – môi trường ấy sẽ được xác định rõ trong mối
quan hệ biện chứng với sự xuất hiện của kỹ thuật.
Tuy nhiên, vì lý do “tiết kiệm” trong tổng thể, thời điểm thứ ba này theo
truyền thống lại thường được thực hiện ngay từ giai đoạn đầu tiên của quá trình
nghiên cứu. Giai đoạn ấy được xem là chung cho việc nghiên cứu nhiều kiểu nhiệm
vụ Ti. Tất cả những kiểu nhiệm vụ này dường như có cùng một môi trường công
nghệ - lý thuyết. Theo một cách thức cổ điển, các kiểu vấn đề xuất hiện ở đây như là
một dãy ứng dụng của khối công nghệ - lý thuyết đã được hình thành như vậy.
• Thời điểm thứ tư: là thời điểm làm việc với kỹ thuật.
34
Thời điểm này là thời điểm hoàn thiện kỹ thuật bằng cách làm cho nó trở nên
hiệu quả nhất, có khả năng vận hành tốt nhất - điều này nói chung thường đòi hỏi
chỉnh sửa lại công nghệ đã được xây dựng cho đến lúc đó. Đồng thời đây cũng là
thời điểm làm tăng khả năng làm chủ kỹ thuật của người học: thời điểm thử thách
kỹ thuật này đòi hỏi phải xét một tập hợp thích đáng cả về số lượng lẫn chất lượng
các nhiệm vụ.
• Thời điểm thứ năm: là thời điểm thể chế hóa.
Mục đích của thời điểm này là chỉ ra một cách rõ ràng những yếu tố của tổ
chức toán học cần xây dựng. Những yếu tố này có thể là kiểu bài toán liên quan, kỹ
thuật được giữ lại để giải, cơ sở công nghệ-lý thuyết của kỹ thuật đó, cách ghi hay
ký hiệu mới. Đặc biệt, phải phân biệt những yếu tố đã tham gia vào quá trình xây
dựng này với những yếu tố thực sự của tổ chức toán học nhắm đến (sự phân biệt mà
HS tìm cách làm rõ khi hỏi thầy giáo là có cần thiết “phải biết” hay không một kết
quả hay một quy trình nào đó).
• Thời điểm thứ sáu: là thời điểm đánh giá.
Thời điểm đánh giá nối khớp với thời điểm thể chế hóa. Trong thực tế, việc
DH phải đi đến một thời điểm mà ở đó người ta phải “điểm lại tình hình”: cái gì có
giá trị, cái gì đã học được, …
Lưu ý rằng cách đặt tên thời điểm thứ nhất, thứ hai, … không có nghĩa là việc
dạy một tổ chức toán học phải thực hiện theo đúng thứ tự này. Hơn nữa, một thời
điểm có thể được thực hiện nhiều lần trong DH.
1.3.5.2. Phân tích thực hành DH của GV
Theo Chevallard, khi phân tích thực hành của GV, nhà nghiên cứu cần phải trả
lời hai câu hỏi:
- Những tổ chức toán học nào được xây dựng trong lớp học ?
- Trong lớp học, GV đã tổ chức việc nghiên cứu các tổ chức toán học ấy như
thế nào ?
Khái niệm thời điểm nghiên cứu mà Chevallard đưa ra chính là để giúp nhà
nghiên cứu trả lời hai câu hỏi này.
35
Đối với nhà nghiên cứu, mô hình các thời điểm nghiên cứu có hai kiểu sử dụng quan
trọng. Trước hết, nó tạo nên một lưới để phân tích các quá trình sư phạm. Sau đó, nó
cho phép đặt ra một cách rõ ràng vấn đề thực hiện những thời điểm nghiên cứu khác
nhau. Chẳng hạn, làm sao để thực hiện một cách cụ thể thời điểm gặp gỡ đầu tiên với
một tổ chức toán học nào đó ? với kiểu nhiệm vụ nào ? dẫn dắt như thế nào việc
nghiên cứu một kiểu nhiệm vụ xác định ? làm thế nào để thực hiện tốt đẹp việc thể chế
hóa ? thực hiện thời điểm đánh giá ra sao ? ... (C. Comiti và Lê Thị Hoài Châu, 2011)
Tóm lại, khái niệm tổ chức didactic với các thời điểm của nó là một công cụ
giúp nhà nghiên cứu mô tả và phân tích cách thức mà GV đã triển khai để truyền bá
một tổ chức toán học cụ thể trong một lớp học cụ thể.
1.4. HỢP ĐỒNG DH
Hợp đồng DH (contrat didactique) là một khái niệm của Lý thuyết tình huống,
được Brousseau đưa vào với mục đích mô hình hóa các quyền lợi và nghĩa vụ ngầm
ẩn của GV cũng như của HS đối với một đối tượng tri thức đem ra giảng dạy. Cụ
thể hơn, đó là “tập hợp các quy tắc xác định, thường là ngầm ẩn, có thể phân nhỏ
một cách rõ ràng thành những điều khoản mà mỗi bên (thầy giáo và HS) có trách
nhiệm thực hiện nghĩa vụ của bên này đối với bên kia”
Cần phải nhấn mạnh rằng đó là những quy tắc đặc thù cho tri thức giảng dạy
chứ không phải là những quy tắc chung chung như kiểu “giờ học toán thì phải mang
theo đầy đủ sách giáo khoa, vở ghi, máy tính, thước kẻ”, “phải ghi vào vở những gì
GV viết bằng phấn màu hoặc đóng khung trên bảng”, hay “GV hỏi thì HS phải trả
lời”, v.v. … Những ví dụ vừa nêu được gọi là các quy tắc của hợp đồng sư phạm
(contrat pédagogique).
Các quy tắc của hợp đồng DH được hình thành như thế nào? Ta có thể tìm
… HS hiểu tình huống được giới thiệu, những câu được hỏi đặt ra, những thông tin
được cung cấp, những ràng buộc phải tuân theo, thông qua những gì giáo viên thực
hiện lặp đi lặp lại - có ý thức hay không trong thực tiễn giảng dạy của mình.
(Brousseau G., 1980)
thấy câu trả lời đầu tiên trong phát biểu sau:
Vậy thì cái gì cho phép GV thực hiện những hoạt động này ?
36
Với tư cách là một thành phần chủ chốt của thể chế DH I, cách mà GV nghĩ về
O, sử dụng O đương nhiên chịu sự chi phối của I. Chẳng hạn, đối với kiểu nhiệm vụ
T, nếu như một kĩ thuật τ nào đó đã được I ưu tiên, việc sử dụng τ thành thạo được I
xem là một kĩ năng cần đạt ở HS, thì không có lí do gì để GV không tập trung vào τ
trong DH. Những quy tắc ngầm ẩn quy định cái GV được phép làm và cần phải làm
được hình thành từ R(I, O). Như vậy, nghiên cứu quan hệ thể chế R(I, O) thông qua
việc phân tích các tổ chức toán học được trình bày, những bài tập được giải hoặc ưu
tiên giảng dạy trong sách giáo khoa sẽ cho phép ta dự đoán về sự tồn tại của những
quy tắc nào đó của hợp đồng DH. Hiển nhiên, đây chỉ là một trong những nhân tố
ảnh hưởng. Vì mỗi cá nhân X đều hoạt động trong nhiều thể chế nên quan hệ
R(X, O) có thể chịu ảnh hưởng của nhiều thể chế khác nhau.
Ví dụ: Xét O là khái niệm XS của một biến cố, I là thể chế DH theo chương
trình và sách giáo khoa thí điểm ban cơ bản (giai đoạn 2003-2006). Phân tích các
hoạt động, bài tập hiện diện trong Sách giáo khoa Đại số và Giải tích lớp 11, phân
tích những lời giải bài tập được đề nghị trong cuốn Sách bài tập tương ứng với sách
giáo khoa này, tác giả Vũ Như Thư Hương (2005) thấy: liên quan đến kiểu nhiệm
vụ tính XS của một biến cố (sơ cấp), chỉ có kỹ thuật áp dụng công thức Laplace
được sử dụng, và trong lời giải cũng không có bước kiểm tra điều kiện áp dụng
công thức (không gian các biến cố sơ cấp là hữu hạn, các biến cố đồng khả năng
xẩy ra). Hiện tượng đó cho phép tác giả đưa ra giả thuyết về sự tồn tại của hợp đồng
DH sau trong thực tế DH: HS luôn dùng định nghĩa cổ điển để tính XS và khi dùng
nó thì không có trách nhiệm phải kiểm tra tính đồng khả năng của các biến cố. Về
phía GV, phân tích trên cũng có thể dẫn ta đến với giả thuyết rằng GV sẽ chỉ ra cho
HS những bài tập thuộc phạm vi hợp thức của định nghĩa cổ điển và cũng không
yêu cầu HS kiểm tra điều kiện áp dụng định nghĩa.
Làm thế nào để xác định hiệu lực của hợp đồng DH
Một phương pháp nghiên cứu hiệu lực của hợp đồng DH là tạo ra sự biến loạn
trong hệ thống giảng dạy, sao cho có thể đặt các thành viên chủ chốt (GV, HS)
trong một tình huống khác lạ - được gọi là tình huống phá vỡ hợp đồng.
37
Để tạo ra những tình huống phá vỡ hợp đồng, người ta có thể tiến hành các
cách sau:
- Thay đổi điều kiện sử dụng tri thức;
- Đặt HS ra ngoài phạm vi của tri thức đang bàn đến hoặc những tình huống mà tri
thức đó không giải quyết được;
- Đặt GV trước những ứng xử của HS không phù hợp với những điều mà GV mong
đợi. Chẳng hạn đó là những câu trả lời khác lạ cho một tình huống.
Thiết kế những tình huống như vậy và quan sát ứng xử của HS, GV, phân tích
sản phẩm (lời, viết) mà họ tạo ra là cách để nhìn thấy hiệu lực của hợp đồng. Việc
các quy tắc hợp đồng vẫn chi phối ứng xử của họ chứng tỏ sự tồn tại của nó. Hoạt
động thiết kế và phân tích này của nhà nghiên cứu được gọi là hoạt động
“thực nghiệm”.
1.5. SAI LẦM VÀ HỢP ĐỒNG DH
Cách nhìn nhận về sai lầm của HS không giống nhau trong những lý thuyết
học tập khác nhau.
Thuyết hành vi cho sai lầm là một hiện tượng có hại đối với việc lĩnh hội kiến
thức và do đó cần tránh. Nói về nguyên nhân của sai lầm thì thuyết hành vi thường
đổ lỗi cho HS hay GV: do HS bất cẩn, không nắm vững kiến thức đã học, kĩ năng
yếu và khả năng suy luận kém, hay do GV trình bày không chính xác, dạy quá
nhanh hay giải thích không đủ rõ ràng,…
Khác với thuyết hành vi, thuyết kiến tạo có một cái nhìn tích cực về sai lầm:
sai lầm thực sự đóng một vai trò quan trọng và cần thiết cho học tập, nhất là khi nó
là hậu quả của những chướng ngại hình thành từ kiến thức cũ. Do đó, vấn đề không
phải là phòng tránh sai lầm, mà là chủ động tổ chức cho HS gặp sai lầm và sửa chữa
nó. Hơn nữa, thuyết kiến tạo đặc biệt nhấn mạnh vai trò chủ động của chủ thể
(người học) trong việc sửa chữa sai lầm.
“Sai lầm không phải chỉ là hậu quả của sự không biết, không chắc chắn, ngẫu nhiên
của những người theo chủ nghĩa kinh nghiệm và chủ nghĩa hành vi, mà còn có thể là
hậu quả của những kiến thức đã có từ trước, những kiến thức đã từng có ích đối với
Didactic Toán có cùng quan điểm với thuyết kiến tạo, như Brousseau đã khẳng định:
38
việc học tập trước kia, nhưng lại là sai, hoặc đơn giản là không còn phù hợp nữa đối
với việc lĩnh hội kiến thức mới. Những sai lầm kiểu này không phải là không dự kiến
trước được, và chúng tạo nên chướng ngại. Trong hoạt động của thầy giáo cũng như
trong hoạt động của học sinh, sai lầm có thể sinh ra từ nghĩa của kiến thức được thu
nhận bởi những chủ thể này.”(Brousseau G., 1983, tr.171)
Nhưng các nhà nghiên cứu Didactic Toán tìm hiểu sâu hơn nguồn gốc của sai
lầm. Họ phân biệt ba nguồn gốc cơ bản, theo đó sai lầm của HS có thể sinh ra từ:
- hạn chế của sự phát triển cá thể,
- những chướng ngại tri thức luận
sự chuyển hóa sư phạm: sự chuyển hóa sư phạm có thể tạo nên những quy -
tắc hành động (tham khảo Bessot A. và tgk, 2009) hay những quy tắc của
hợp đồng DH.
Trong luận án, chúng tôi đặc biệt quan tâm đến loại sai lầm có nguồn gốc từ
hợp đồng DH và chuyển đổi sư phạm được hình thành ngầm ẩn từ sách giáo khoa
hay từ hoạt động giảng dạy của GV.
1.6. ĐỒ ÁN DH
1.6.1. Khái niệm đồ án DH
Thuật ngữ đồ án DH được chuyển ngữ từ gốc tiếng Pháp ingénierie
didactique. Khái niệm này đã xuất hiện từ những năm đầu của thập kỷ 1980. Bản
thân từ ingénierie đã nói lên công việc của một kỹ sư. Cụ thể, Michèle Artigue
[…] thuật ngữ ingénierie nói về một kiểu công việc trong nghiên cứu didactic. Công
việc này có thể so sánh với công việc của người kỹ sư. Để thực hiện một dự án xác
định, người kỹ sư dựa trên những kiến thức khoa học thuộc lĩnh vực chuyên môn của
mình, chấp nhận tuân theo một sự kiểm tra về mặt khoa học, nhưng đồng thời anh ta
cũng ở trong tình thế buộc phải làm việc với những đối tượng phức tạp hơn nhiều so
với những đối tượng đã được làm rõ của khoa học. Điều này khiến người kỹ sư hầu
như phải tìm cách giải quyết, với tất cả các phương tiện mà con người sẵn có, những
vấn đề mà khoa học không muốn hoặc chưa thể nhận trách nhiệm giải quyết.
(1988) viết:
39
Như vậy, đồ án DH là một (hay một chuỗi) tình huống DH mà nhà nghiên cứu
đã xây dựng, trên cơ sở các kiến thức của một lĩnh vực khoa học, nhằm làm cho
người học làm việc trên những đối tượng phức tạp, trong một mục đích DH nào đó.
1.6.2. Chức năng kép của đồ án DH
Đồ án DH cho phép:
- vận hành trong hệ thống giảng dạy những hoạt động DH được xây dựng từ các
công trình nghiên cứu của Didactic Toán và các kết quả thu được từ trước.
- kiểm chứng các sản phẩm lý thuyết do nhà nghiên cứu thực hiện và triển khai
trong một hệ thống giảng dạy.
1.6.3. Các pha khác nhau của việc nghiên cứu một đồ án DH
1.6.3.1. Pha nghiên cứu tri thức
Để xây dựng một đồ án DH trước hết người ta phải tìm hiểu những kết quả
nghiên cứu liên quan đến tri thức nhắm đến trong đồ án, tiến hành các phân tích ban
đầu về:
- Đặc trưng tri thức luận của tri thức đó
- Phân tích kiến thức (quan niệm) của HS cũng như những khó khăn, chướng
ngại gặp phải trong việc học;
- Phân tích quan hệ thể chế (thực hiện qua việc nghiên cứu ít nhất là chương
trình và sách giáo khoa được sử dụng trong DH).
Những phân tích này không thể thiếu, vì đồ án DH phải nhắm đến một sự thỏa
mãn tốt hơn các đặc trưng tri thức luận và phù hợp hơn với đặc điểm tâm sinh lý
của HS. Trong phần 1.7 chúng tôi sẽ trình bày đầy đủ lợi ích của các phân tích này.
1.6.3.2. Pha xây dựng đồ án
Ở pha này nhà nghiên cứu xác định vấn đề sẽ được đưa ra cho người học
nghiên cứu, dàn dựng kịch bản, phân tích tiên nghiệm đồ án đã xây dựng, dự kiến
những kiểu DL cần thu thập. Pha này phải tính đến những phân tích đã được thực
hiện ở pha trước và lựa chọn giá trị của các biến didactic sao cho cái nhà nghiên
cứu muốn xuất hiện sẽ phải xuất hiện khi triển khai đồ án trong thực tế. Phân tích
40
tiên nghiệm về đồ án được xây dựng là cần thiết. Nó cho phép dự kiến những cái có
thể quan sát khi thực hiện đồ án DH.
Khái niệm phân tích tiên nghiệm đã được trình bày ở trên. Chúng tôi sẽ giải
thích rõ hơn khái niệm biến didactique (variable didactique).
Biến didactic
Một biến didactic là một tham số, có thể nhận nhiều giá trị. Sự thay đổi giá trị
của biến didactic sẽ dẫn đến sự thay đổi thứ tự của các chiến lược giải của HS. Như
vậy, thông qua sự lựa chọn giá trị của biến didactic, nhà nghiên cứu có thể “tạo ra
những thích nghi và những điều chỉnh mong muốn, tức là tạo ra việc học tập”
(Brousseau, 1982b). Cụ thể hơn, giá trị của biến phải được chọn sao cho chiến lược
cũ trở nên “đắt giá”, quá tốn kém, quá phức tạp hoặc thậm chí dẫn đến sai lầm.
Để minh họa, chúng tôi lấy giới thiệu vắn tắt tình huống phóng to hình đã
được Brousseau N. và Brousseau G. (1987) thiết lập để dạy số hữu tỉ. Tình huống
được xây dựng bao gồm việc giải quyết vấn đề sau: HS làm việc theo nhóm, mỗi
nhóm được phát một miếng bìa hình chữ nhật có kích thước là 20cm × 15cm trên đó
có hình vẽ gồm 6 mảnh ghép (Hình 1.1) và một số tờ giấy kẻ ô vuông. Mỗi HS có
một thước dài 20cm.
Hình 1.1. Các mảnh ghép trên miếng bìa hình chữ nhật
Nhiệm vụ của nhóm là tạo ra những hình tương tự lớn hơn so với hình mẫu đã
cho và tuân thủ quy tắc: đoạn thẳng dài 4cm trên hình mẫu thì phải có độ dài 7cm
trên bản sao. Nguyên tắc làm việc là: mỗi HS phải phóng to một hay hai mẩu. Khi
mỗi HS đã làm xong, các em ghép lại với nhau sao cho có được một hình giống với
hình mẫu.
41
Phân tích tiên nghiệm cho thấy có hai chiến lược không dẫn đến thành công:
Chiến lược 1: thêm 3 vào số đo các cạnh của “các góc vuông”; Chiến lược 2: nhân
mỗi số đo với 2 rồi bớt đi 1. Hai chiến lược này dựa vào những kiến thức liên quan
đến số tự nhiên và hình phóng to: Để phóng to, người ta thêm hoặc nhân với một số
nguyên. Nghĩa của phép nhân với một số nguyên là phép cộng lặp lại. Hơn nữa, nếu
ta thêm một số nguyên dương vào một số (và cũng vậy nếu nhân một số nguyên
dương với một số), ta sẽ có một số nguyên lớn hơn. Nghĩa của phép nhân với một
số hữu tỷ cần được xây dựng thì chống lại cái nghĩa đầu tiên ấy. Nhà nghiên cứu
muốn tạo ra một môi trường (vật chất) có tác động phản hồi khiến HS phải loại bỏ
=
+
hai chiến lược này. Muốn thế, nhà nghiên cứu chọn biến là cặp (n,p), với n và p là
p
kn
p =
kn
n 2
hai số xác định tỷ lệ phóng to. Những giá trị có thể chọn là: ,
p n
(k nguyên, n chẵn), là số hữu tỷ không thập phân. Chẳng hạn, các cặp số nguyên
(4,8), (4,6), (4,7), (3,7) minh họa cho các loại giá trị trên. Việc phóng to từ 4 sang 8
làm người ta nghĩ tới phép nhân với 2, cũng có nghĩa là 4 + 4. HS vẫn ở trong
khuôn khổ mô hình cộng và phạm vi các số nguyên. Việc phóng to từ 4 sang 6 được
coi như “x cộng thêm nửa x”. Ta sẽ có một mô hình trung gian giữa mô hình cộng
và mô hình tuyến tính, “gần” với mô hình cộng hơn vì trong trường hợp này, một
nửa cũng là một số nguyên. Việc phóng to từ 4 sang 7 không còn là chuyển đổi bình
thường nữa, nhưng vẫn có khả năng chia cho 2 (sự phóng to này có thể được xem
như “2 lần x trừ đi một nửa của một nửa của x”). Có một bước nhảy khi “chuyển từ
3 qua 7”, vì không tìm được hệ thức nào giữa chúng. HS bắt buộc phải từ bỏ mô
hình cộng và phạm vi các số nguyên. Như vậy, giá trị chọn phù hợp của biến sẽ làm
nảy sinh nghĩa của phép nhân với một số hữu tỷ, cho phép chuyển từ phép nhân với
một số nguyên (mô hình cộng, phép cộng lặp lại) sang phép nhân với một số hữu tỷ
(mô hình nhân, ảnh của ánh xạ tuyến tính).
42
Biến didactic và hợp đồng DH
Biến didactic liên quan đến tri thức toán học và nhà nghiên cứu hoàn toàn có
thể thay đổi các giá trị của các biến này trong bất kỳ giai đoạn nào của thực nghiệm
thông qua việc thay đổi các yếu tố toán học của bài toán. Việc chọn thời điểm thay
đổi giá trị của biến didactic trong một kiểu nhiệm vụ phụ thuộc vào mục đích và
điều kiện nghiên cứu (quỹ thời gian, phương pháp xử lý DL, …).
Trong trường hợp muốn nghiên cứu ảnh hưởng của các quy tắc của hợp đồng
DH, nhà nghiên cứu có thể lựa chọn giá trị của biến didactic sao cho HS được đặt
vào một tình huống không quen thuộc gọi là tình huống phá vỡ hợp đồng (các giá
trị “quen thuộc” của biến didactic trong một kiểu nhiệm vụ cụ thể thường gắn liền
với một hoặc nhiều quy tắc của hợp đồng DH).
Trước cùng một kiểu nhiệm vụ, với các giá trị thay đổi của biến didactic qua
từng pha của thực nghiệm, nhà nghiên cứu sẽ cần nhiều thời gian hơn, phải phân
tích DL nhiều hơn nhưng có thể quan sát được những ứng xử khác nhau của HS.
Nhà nghiên cứu cũng có thể khảo sát sự thay đổi của chiến lược theo sự thay đổi các
quy tắc của hợp đồng thông qua việc thay đổi giá trị biến didactic. Từ đó, có thể rút
ra vai trò của từng nhóm giá trị biến, vốn bị che giấu bởi hợp đồng.
Ngược lại, nếu cho biến didactic nhận một giá trị “không quen thuộc” (so với
quan hệ thể chế) ngay từ đầu thực nghiệm, nhà nghiên cứu có thể tiết kiệm thời gian
thực nghiệm, công sức phân tích và chứng minh được sự tồn tại của hợp đồng DH.
1.6.3.3. Pha thực nghiệm: triển khai đồ án trong thực tế và tổ chức quan sát
trên lớp học.
Tùy vào mục đích đặt ra mà nhà nghiên cứu tổ chức việc quan sát và thu thập
DL. Phân tích hậu nghiệm (những cái quan sát được) để xem có thể hợp thức hóa
(nội tại) hay không những gì đã dự kiến khi xây dựng đồ án.
1.7. PHÂN TÍCH TRI THỨC LUẬN TRONG DIDACTIC TOÁN
1.7.1. Về thuật ngữ phân tích tri thức luận
Khái niệm phân tích tri thức luận và lợi ích của nó trong Didactic Toán đã
được tác giả Lê Thị Hoài Châu làm rõ trong một công trình nghiên cứu khoa học
43
cấp bộ (mã số B2001.23.02), sau đó công bố trong Tạp chí Khoa học Đại học Sư
phạm Tp HCM số 32 (năm 2002), rồi trong Bessot A. và các tác giả (2009). Trong
phần dưới chúng tôi sẽ nêu những điểm cơ bản về khái niệm này.
Phân tích tri thức luận là khái niệm chuyển ngữ từ gốc từ analyse
épistémologique của tiếng Pháp. Trong ấn bản đầu tiên, tác giả Lê Thị Hoài Châu
(2002) chuyển ngữ sang tiếng Việt là phân tích khoa học luận. Nhiều công trình sau
đó sử dụng lại từ này. Tuy nhiên, trong ấn bản thứ hai (Bessot A. và tgk, 2009), tác
giả dịch là phân tích tri thức luận vì cho rằng từ này phản ánh chính xác hơn nội
Thuật ngữ tri thức luận (épistémologie) xuất hiện vào thế kỉ 19, được hình thành từ
hai từ gốc Hi Lạp épistème (khoa học) và logos (nghiên cứu về). Thuật ngữ này đã
được hiểu theo những nghĩa khác nhau. Trong Didactic Toán, người ta quan tâm đến
phân tích tri thức luận theo nghĩa nó “nghiên cứu những điều kiện sản sinh ra các kiến
thức khoa học, giúp cho ta hiểu rõ hơn mối liên hệ giữa việc tạo ra tri thức trong cộng
đồng các nhà bác học với việc dạy và học tri thức này” (Lê Thị Hoài Châu, 2002).
hàm của khái niệm analyse épistémologique.
Quan niệm rằng để thiết kế hay phân tích hoạt động DH một tri thức thì yếu tố
đầu tiên cần xem xét là chính tri thức đó, Didactic Toán đã xây dựng Thuyết nhân
học như một công cụ nghiên cứu đối tượng cần dạy. Nhưng, như chúng tôi sẽ chỉ ra
ở dưới, việc nghiên cứu quan hệ thể chế với đối tượng tri thức chưa đủ để hiểu về tri
thức đó, để nhìn thấy sự biến đổi mà tri thức phải chịu do ràng buộc của thể chế, để
trả lời nhiều câu hỏi khác liên quan đến việc DH nó. Khái niệm phân tích tri thức
Phân tích tri thức luận là nghiên cứu lịch sử hình thành tri thức, nhằm vạch rõ:
- nghĩa của tri thức, những bài toán, những vấn đề mà tri thức đó cho phép giải quyết;
- những trở ngại cho sự hình thành tri thức;
- những bước nhảy trong quan niệm, những điều kiện sản sinh ra tri thức;
- những quan niệm có thể gắn liền với tri thức.
Phân tích ấy sẽ giúp ta hiểu rõ mối liên hệ giữa quá trình xây dựng tri thức trong cộng đồng khoa học với việc dạy và học tri thức này. (Lê Thị Hoài Châu, 2002, tr. 4)
luận mang lại một công cụ bổ sung cho việc tìm hiểu tri thức.
1.7.2. Lợi ích của phân tích tri thức luận
1.7.2.1. Sự chuyển hóa sư phạm và lợi ích của phân tích tri thức luận
Sự chuyển hóa sư phạm biến một tri thức bác học thành một đối tượng có thể
44
dạy được cho một bộ phận xã hội xác định. Nhưng những biến đổi mà tri thức phải
chịu để trở thành đối tượng giảng dạy rất ít khi xuất phát từ lý do gắn liền với sự sản
sinh ra tri thức này. Chúng thường chỉ là giải pháp tình huống, chủ yếu là tuân theo
các ràng buộc nội tại của thể chế DH.
Tất nhiên, tri thức chương trình và sách giáo khoa đã được hình thành trên cơ
sở lấy tri thức bác học làm tham chiếu. Nhưng vẫn còn một số điểm tối trong mối
Trong khi trường học sống trong ảo tưởng rằng đối tượng dạy học là một bản copy,
tuy đã được đơn giản hoá nhưng vẫn trung thành, của đối tượng khoa học, thì phân
tích tri thức luận sẽ giúp nhà nghiên cứu hiểu rõ cái gì chi phối sự tiến triển của kiến
thức khoa học, đâu là sự chênh lệch giữa tri thức bác học với tri thức được dạy, đâu là
khoảng cách giữa hai hệ thống – toán học và dạy học.
Phân tích tri thức luận giúp ta vạch rõ các tham chiếu hợp thức của tri thức cần dạy,
trả lại cho tri thức những nghĩa rộng hơn, phong phú hơn, điều mà việc nghiên cứu
đơn thuần chương trình và sách giáo khoa không thể mang lại. Những hiểu biết khoa
học luận về tri thức cần dạy giúp nhà nghiên cứu và giáo viên nhìn nó ở một khoảng
cách cần thiết, […] không chỉ xem xét nó dưới lăng kính của chương trình và sách
giáo khoa. (Lê Thị Hoài Châu, 2002, tr.10)
liên hệ giữa tri thức bác học với tri thức được dạy.
1.7.2.2. Vấn đề thiết kế tình huống DH và lợi ích của phân tích tri thức luận
Các nghiên cứu hoạt động DH toán nói chung đều liên quan đến sự xây dựng
kiến thức ở chủ thể người học - HS. Nhà nghiên cứu phải đương đầu với vấn đề
thiết kế hay phân tích sự hình thành kiến thức khoa học trong một tình huống DH.
Vấn đề là phải “tái tạo” lại trong lớp học một sự hình thành nên những khái niệm
toán học với cái nghĩa mà ta muốn HS chiếm lĩnh. Nói cách khác, xây dựng một
tình huống trong đó tri thức cần dạy phải xuất hiện như một giải pháp tối ưu được
xem là mục đích của việc thiết kế một tình huống hay một đồ án DH. Khi thiết kế
hoặc phân tích một tình huống DH, trước hết nhà nghiên cứu phải tìm cách trả lời
những câu hỏi sau:
- Liệu có đảm bảo rằng vấn đề được đặt ra trong tình huống là đích thực đối
với tri thức hay không ? Từ đích thực ở đây được hiểu theo nghĩa tri thức cần dạy là
tri thức hoặc không thể thiếu, hoặc đem lại một chiến lược tối ưu cho việc giải
quyết vấn đề được đặt ra.
45
- Vấn đề đó có mối liên hệ như thế nào với lý do tồn tại của đối tượng tri thức
được xem là mục đích của hoạt động dạy-học ?
- Vấn đề ấy đưa lại cho tri thức cái nghĩa nào ?
Đó là những câu hỏi mang tính chất tri thức luận.
Dựa vào đâu để kiến tạo những tình huống như vậy, khi mà nghĩa của tri thức
và tình huống mang lại nghĩa đó đã bị che dấu qua quá trình chuyển hóa sư phạm
Phân tích tri thức luận lịch sử hình thành tri thức cho phép vạch rõ quá trình xây dựng
tri thức trong cộng đồng các nhà khoa học, sự phụ thuộc của nó vào các lĩnh vực toán
học có liên quan, từ đó xác định được nghĩa của tri thức, tình huống mang lại nghĩa
đó, điều kiện cho phép tri thức nảy sinh, hay ngược lại, cản trở sự tiến triển của nó,
những vấn đề gắn liền với tri thức, vị trí tương đối của nó trong một tri thức tổng quát
hơn, … Nó sẽ dẫn nhà nghiên cứu đến với câu trả lời cho một số câu hỏi tổng thể và
cơ bản sau, là cơ sở cho việc phân tích hay thiết kế các tình huống dạy-học: tri thức
được sinh ra nhằm giải quyết vấn đề gì ? Tri thức có thể tồn tại dưới những dạng thức
nào ? Chuyển từ dạng thức này sang dạng thức kia tương ứng với sự thay đổi nào
trong quan niệm ? (Lê Thị Hoài Châu, 2001, tr.9)
mà tri thức phải chịu ?
1.7.2.3. Các lợi ích khác của phân tích tri thức luận
Trong một sự học tập bằng thích nghi với tình huống, việc vượt qua những chướng ngại tri thức luận5 là điều không thể tránh khỏi, hơn thế, nó đóng vai trò
quyết định đối với quá trình xây dựng tri thức. Đồng thời, khi việc học xẩy ra bằng
thích nghi với tình huống thì có thể có những quan niệm tạm thời được hình thành,
phù hợp với một lớp tình huống này, nhưng lại không còn đúng trong tình huống
tổng quát. Vấn đề là phải biết chống lại những quan niệm cũ đã lỗi thời. Quan niệm
mới xuất hiện như là một giải pháp tối ưu cho tình huống mới.
Việc thiết kế những tình huống ấy đòi hỏi trước hết phải xác định được
chướng ngại cần vượt qua và quan niệm cần loại bỏ. Phân tích tri thức luận sẽ giúp
5 Về khái niệm chướng ngại, bạn đọc có thể tham khảo Bessot A. và tgk, 2009.
nhà nghiên cứu làm điều đó. Hiển nhiên, không phải mọi chướng ngại mà các nhà
46
toán học phải đương đầu trong lịch sử đều là chướng ngại của việc học tập ngày
nay, nhưng những chướng ngại học tập thường có thể tìm thấy dấu vết trong lịch sử.
1.8. VẤN ĐỀ MÔ HÌNH HÓA TRONG DH TOÁN
1.8.1. Về các thuật ngữ mô hình hóa, mô hình và mô hình toán học
Để vận dụng kiến thức toán học vào việc giải quyết những tình huống của thực
tế người ta phải toán học hóa tình huống đó, tức là xây dựng một mô hình toán học
thích hợp cho phép tìm một câu trả lời cho tình huống. Quá trình này gọi là quá
trình mô hình hóa toán học (mà trong luận án, để ngắn gọn, chúng tôi sẽ gọi tắt là
mô hình hóa).
Theo Từ điển bách khoa toàn thư, mô hình hóa toán học là sự giải thích toán
học cho một hệ thống ngoài toán học nhằm trả lời những câu hỏi mà người ta đặt ra
Mô hình hóa toán học là quá trình chuyển đổi một vấn đề thực tế sang một vấn đề toán
học bằng cách thiết lập các mô hình toán học và giải quyết vấn đề trong mô hình đó,
thể hiện và đánh giá lời giải trong ngữ cảnh thực tế, cải tiến mô hình nếu cách giải
quyết không thể chấp nhận.
trên hệ thống này. Một cách cụ thể hơn, Edwards và Hamson (2001) định nghĩa :
Trong phát biểu trên, cùng với mô hình hóa toán học tác giả đã sử dụng các
thuật ngữ mô hình, mô hình toán học. Dưới đây chúng tôi sẽ đưa ra một giải thích
ngắn gọn cho phép phân biệt ba thuật ngữ này.
Thuật ngữ mô hình được sử dụng ở nhiều khoa học, cả tự nhiên lẫn xã hội, với
những nghĩa khác nhau. Dưới đây là hai nghĩa phổ biến của nó.
Theo nghĩa thứ nhất, mô hình là vật có cùng hình dạng với vật ta cần nghiên
cứu, nhưng được thu nhỏ lại. Nó mô phỏng cấu tạo, thể hiện các đặc trưng của vật
mà ta cần xem xét. Ví dụ:
- Sử dụng các mô hình về hình chóp, hình lăng trụ trong DH khái niệm và tính chất
của các loại hình này.
- Mô hình máy bay dùng trong các nghiên cứu về cơ chế hoạt động của nó.
- Mô hình nhà ở kiểu mới trong một triển lãm.
47
Nghĩa này có thể được mở rộng cho các đối tượng trừu tượng, phi vật chất.
Chẳng hạn người ta nói: R² với hai phép toán cộng và nhân với số thực định nghĩa
+
=
+
+
(
)
(
)
(x
, x
(
,
)
như sau:
x x , 1 2
y y , 1
2
1
y 1
2
y ) 2
a x x 1 2
ax= ( 1
, ax ) 2
; )
là một mô hình của khái niệm không gian vectơ n-chiều
Nghĩa thứ hai - cũng thường được dùng - của thuật ngữ này: mô hình là cái thu
được từ việc diễn đạt theo một ngôn ngữ nào đó các đặc trưng chủ yếu của một đối
tượng để nghiên cứu đối tượng ấy.
Luận án của chúng tôi sử dụng thuật ngữ mô hình với nghĩa thứ hai. Theo
nghĩa đó mô hình là “một biểu diễn cho các phần quan trọng của một hệ thống có
sẵn (hoặc sắp được xây dựng) với mục đích sắp xếp kiến thức về hệ thống đó dưới
một dạng có thể dùng được” (Eykhoff P., 1974)
Trong cách hiểu này, mô hình toán học là một mô hình biểu diễn (cho hệ
thống, vấn đề cần nghiên cứu) bằng ngôn ngữ toán học.
1.8.2. Quá trình mô hình hóa
Nhiều nghiên cứu về giáo dục toán đề cập đến quá trình mô hình hóa toán học.
Các tác giả đã đưa ra những sơ đồ khác nhau để nói về quá trình này. Tuy nhiên, dù
dùng sơ đồ nào thì họ đều đề cập đến 4 bước sau đây của quá trình mô hình hóa.
Bước 1: Xây dựng mô hình trung gian của vấn đề được đặt ra, tức là xác định
những yếu tố có ý nghĩa quan trọng nhất trong hệ thống (thực tiễn) và xác lập các
qui luật phải tuân theo khi nghiên cứu vấn đề. Mô hình trung gian này còn được gọi
là mô hình phỏng thực tiễn. Theo nghĩa thứ hai mà chúng tôi đã trình bày ở trên về
thuật ngữ mô hình thì mô hình phỏng thực tiễn biểu diễn (hệ thống, vấn đề cần
nghiên cứu) bằng ngôn ngữ của hệ thống, có thể kết hợp thêm với ngôn ngữ khác,
trong đó chỉ giữ lại những thông tin (về hệ thống, vấn đề cần giải quyết) được người
nghiên cứu cho là thỏa đáng, là cần thiết.
Bước 2: Xây dựng mô hình toán học cho vấn đề đang xét, tức là diễn tả lại
dưới dạng ngôn ngữ toán học cho mô hình trung gian. Lưu ý là ứng với vấn đề đang
48
xem xét có thể có nhiều mô hình toán học khác nhau, tùy theo chỗ các yếu tố nào
của hệ thống và mối liên hệ nào giữa chúng được xem là quan trọng.
Bước 3: Sử dụng các công cụ toán học để khảo sát và giải quyết bài toán hình
thành ở bước hai. Căn cứ vào mô hình (toán học) đã xây dựng cần phải chọn hoặc
xây dựng phương pháp giải cho phù hợp.
Bước 4: Phân tích và KĐ lại các kết quả thu được trong bước ba. Trong phần
này phải xác định mức độ phù hợp của mô hình và kết quả tính toán với vấn đề thực
tế hoặc áp dụng phương pháp phân tích chuyên gia.
Ở bước này có thể xảy ra một trong hai khả năng:
Khả năng 1: Mô hình và các kết quả tính toán phù hợp với thực tế.
Khi đó chỉ cần tổng kết lại cách đặt vấn đề, mô hình toán học đã xây dựng, các
thuật toán đã sử dụng, kết quả thu được.
Khả năng 2: Mô hình và kết quả không phù hợp với thực tế.
Lúc này phải tìm nguyên nhân. Có thể đặt ra những câu hỏi sau:
- Các kết quả tính ở bước thứ ba có đủ độ chính xác không ?
Để trả lời, người ta phải kiểm tra lại các thuật toán, các quy trình, các tính toán
đã sử dụng. Ở đây, người ta tạm chấp nhận rằng mô hình toán học (và cũng có
nghĩa là mô hình trung gian) xây dựng như vậy là thỏa đáng.
- Mô hình toán học xây dựng như thế đã thỏa đáng chưa ? Nếu chưa thì phải
xây dựng lại. Với loại câu hỏi này, ta tạm chấp nhận mô hình trung gian đã xây
dựng, nhưng phải xem xét lại mô hình toán học đã lựa chọn.
- Mô hình trung gian xây dựng có phản ánh được đầy đủ hiện tượng thực tế
không ? Nếu không thì cần phải rà soát lại bước 1 xem có yếu tố, qui luật nào bị bỏ
sót không.
- Các số liệu ban đầu (các thông số, hệ số) có phản ánh đúng thực tế không ?
Nếu không thì phải điều chỉnh lại một cách nghiêm túc và chính xác.
Hai câu hỏi cuối đặt ra cho mô hình trung gian đã được xây dựng.
Như thế, mô hình hóa toán học là quá trình cấu trúc lại vấn đề ngoài toán học
nhờ những khái niệm toán học được lựa chọn một cách phù hợp. Quá trình ấy được
49
thực hiện thông qua việc xây dựng mô hình phỏng thực tế bằng cách “cắt tỉa” – hay
ngược lại, bổ sung thông tin - để có thể gắn vấn đề ban đầu với các quy trình toán
học. Trong bước tìm kiếm mô hình phỏng thực tế này người ta thường phải thực
hiện những việc như đặt giả thuyết, tổng quát hóa, hình thức hóa,… Bài toán toán
học cuối cùng được xây dựng phải đại diện trung thực cho bối cảnh thực tế. Cùng
một vấn đề của thực tiễn có thể có nhiều mô hình toán học khác nhau.
Quá trình mô hình hóa có thể được tóm lược qua sơ đồ 1.4
HỆ THỐNG NGOÀI TOÁN HỌC Câu hỏi liên quan đến hệ thống
Câu trả lời cho câu hỏi ban đầu
Rút gọn hệ thống (giữ lại những thông tin thỏa đáng)
Mô hình trung gian
(duy trì mối liên hệ về ngữ nghĩa đối với hệ thống
mà ta tìm cách mô hình hóa)
Trình bày lại các câu hỏi
Giải bài toán
Câu trả lời cho bài toán toán học
MÔ HÌNH TOÁN HỌC
Sơ đồ 1.4. Quá trình mô hình hóa
1.9. KẾT LUẬN CHƯƠNG 1
Những công cụ lý thuyết trình bày trong Chương 1 không chỉ cho phép mô tả
các hoạt động DH mà còn có khả năng phân loại, giải thích các sự kiện đã và sẽ xảy
ra trong tình huống. Chúng mang lại cho chúng tôi những mô hình nghiên cứu phù
hợp với câu hỏi đã được đặt ra ở đầu luận án.
50
CHƯƠNG 2
XÁC SUẤT – THỐNG KÊ VÀ Y HỌC:
TỪ TOÁN HỌC ĐẾN NHỮNG NGHIÊN CỨU THỰC TIỄN ĐẦU TIÊN
Cơ thể con người là một thực thể sinh học luôn chịu sự tác động qua lại của
các yếu tố môi trường và vũ trụ xung quanh. Sức khỏe của một cá nhân, một cộng
đồng dân cư nằm trong mối liên hệ với các yếu tố tổng hợp của môi trường sinh
thái. Chính vì thế, các quá trình sinh lý và sinh hóa diễn ra trong cơ thể con người
cũng tuân theo một số quy luật toán học về mặt sinh học. (Đỗ Hàm, 2007)
Là một ngành khoa học thực nghiệm, mọi kết quả mang tính quy luật của Y –
Dược học đều phải được rút ra từ các nghiên cứu trên mẫu. Chính vì thế mà XS-TK
là công cụ lý thuyết không thể thiếu của khoa học này. Cũng vì lẽ đó, nghiên cứu
thực tiễn đầu tiên của chúng tôi sẽ được đặt trên hai hướng:
- Công cụ XS-TK được các nhà nghiên cứu y học của Việt Nam sử dụng ra sao ?
- Việc DH XS-TK trang bị công cụ này ra sao cho sinh viên đại học Y – Dược ?
Hướng thứ nhất nảy sinh từ ghi nhận về những khó khăn của nhiều học viên
cao học, nghiên cứu sinh và một số nhóm nghiên cứu của Đại học Y Dược Tp HCM
mà chúng tôi có cơ hội hợp tác: họ có nhiều lúng túng khi phân tích DL. Vì vậy,
theo hướng thứ nhất, chúng tôi sẽ chỉ ra một số sai lầm liên quan đến việc sử dụng
XS-TK, được tìm thấy trong các công trình nghiên cứu thuộc lĩnh vực Y – Dược.
Trước khi phân tích các sai lầm đó, chúng tôi sẽ bắt đầu bằng việc làm rõ những
ứng dụng cơ bản của XS-TK trong Y - Dược học, một thể chế sử dụng tri thức, theo
ngôn ngữ của Thuyết nhân học trong Didactic Toán. Kết quả nghiên cứu trên hướng
thứ nhất sẽ được trình bày trong hai phần đầu của chương.
Cũng chính ghi nhận thực về sự lúng túng của nhiều nhà nghiên cứu khi sử
dụng công cụ XS-TK đã khiến chúng tôi mong muốn thực hiện một tìm hiểu sơ bộ
về thực tế đào tạo ở trường Đại học Y Dược Tp HCM trong lĩnh vực XS - TK. Điều
này được thực hiện thông qua việc quan sát giờ dạy một nội dung thuộc chương
trình XS-TK của trường. Giống như trên, trước khi quan sát giờ dạy, chúng tôi sẽ
51
làm rõ ứng dụng của XS-TK trong chẩn đoán – điều trị. Nghiên cứu theo hướng thứ
hai này được trình bày trong hai phần cuối của chương.
2.1. NHỮNG ỨNG DỤNG CƠ BẢN CỦA XS-TK TRONG NGHIÊN CỨU Y HỌC
Việc sử dụng XS-TK trong nghiên cứu y học góp phần đánh giá những vấn đề
về bệnh tật của con người, xác định các yếu tố nguy cơ, mối quan hệ nhân quả,
Thống kê y sinh học là môn toán ứng dụng dùng để nghiên cứu và phân tích các vấn
đề và sự kiện liên quan đến y sinh học. Đó chính là sự toán học hóa các vấn đề sinh
học và sức khỏe con người, làm cho nó phổ biến và đặc trưng cũng như sự trừu tượng
hoặc cụ thể về nội dung và hình thức được nâng lên một bước rõ rệt và sâu sắc hơn để
cho sự hiểu biết cũng tiến dần đến bản chất. (Đỗ Hàm, 2007)
Trong y học, những khái niệm và nguyên tắc thống kê học cũng được ứng dụng trong
mọi hoạt động, từ chẩn đoán đến điều trị bệnh cho từng con người, từ điều tra dịch tễ,
chẩn đoán cộng đồng, đến thiết kế và lượng giá những chương trình can thiệp, nhằm
bảo vệ và nâng cao sức khỏe cộng đồng, đồng thời giúp ta có thể dự báo được những
diễn biến sắp tới. (Lê Trường Giang, 2007)
tương quan giữa môi trường sinh thái với sức khỏe cộng đồng.
Dưới đây chúng tôi sẽ cố gắng làm rõ vai trò của XS-TK thông qua những ứng
dụng cơ bản của nó trong các nghiên cứu của y học. Với mục đích này, việc phải
nhắc đến các công thức, các phương pháp của XS-TK là không tránh khỏi. Tuy
nhiên, do khuôn khổ có hạn và đặc biệt là do tính chất của luận án, chúng tôi không
đi sâu vào lĩnh vực XS-TK mà sẽ chỉ làm rõ “cái hồn” của nó trong các nghiên cứu
y học. Một phân tích bổ sung về những ứng dụng của nó sẽ được trình bày trong
Phụ lục 1 – Một số ứng dụng của XS-TK trong y học của luận án.
Để phát triển một loại thuốc mới, một phương pháp điều trị mới, nhà nghiên
cứu phải thực hiện và trải qua nhiều giai đoạn: tìm công thức hóa học, thử nghiệm
trên những động vật có đặc tính sinh học gần giống con người (thỏ, chuột, khỉ, …),
thử nghiệm trên người (tình nguyện viên), ghi nhận những thông số liên quan và
cuối cùng là chứng tỏ thuốc mới có hiệu quả điều trị bằng các phương pháp của TK.
Để thực hiện các phương pháp này, ba bài toán sau đây của TK cần được sử dụng:
chọn mẫu, ước lượng khoảng tin cậy và KĐ giả thuyết TK. Những ví dụ minh họa
52
trong phần dưới đều lấy từ thực tế – tìm thấy trong một số tài liệu nghiên cứu, tạp
chí khoa học về y học và các đề tài nghiên cứu đã được thực hiện.
2.1.1. Chọn mẫu
Chọn mẫu là công việc rất quan trọng của một công trình nghiên cứu. Nếu
mẫu chọn không đại diện được cho tổng thể thì nghiên cứu trên mẫu không cho
phép đưa ra những dự đoán thỏa đáng cho tổng thể.
Trong chọn mẫu, xác định cỡ mẫu là một trong những việc cần thực hiện đầu
tiên. Cỡ mẫu nhỏ thì mẫu sẽ không phản ánh đầy đủ thông tin của quần thể nghiên
cứu, dẫn đến những kết luận không đáng tin cậy. Ngược lại, cỡ mẫu lớn sẽ làm hao
tốn tài nguyên, kinh phí, thậm chí làm hư hại quần thể, vi phạm y đức. Đối với mỗi
bài toán TK, cách chọn mẫu cũng khác nhau tùy theo mục đích nghiên cứu và tính
chất của biến ngẫu nhiên. Việc tính cỡ mẫu phải dựa vào những thông tin đã biết về
quần thể (qua các công trình đã thực hiện) hoặc phải tiến hành nghiên cứu mô
phỏng để thu thập các thông tin cần thiết.
Chúng ta biết rằng chọn mẫu là một bài toán cơ bản của lý thuyết TK và lý
thuyết này cung cấp cho ta các công thức xác định cỡ mẫu tùy theo tình huống, mục
đích nghiên cứu.
2.1.2. Ước lượng khoảng tin cậy và kiểm định giả thuyết thống kê
Để đưa ra những kết luận cho tổng thể từ những kết quả thu được qua phân
tích các đặc trưng của mẫu thì các nghiên cứu trong y học không thể nào không đối
diện với bài toán ước lượng và KĐ giả thuyết TK.
Cụ thể là sau khi xác định cỡ mẫu, thu thập DL, nhà nghiên cứu tính các thông
số TK liên quan đến mẫu vừa thu thập như trung bình, phương sai, độ lệch chuẩn,
sai số chuẩn, trung vị, yếu vị, nguy cơ tương đối (RR), tỷ số nguy cơ (OR), … Để
biết độ dao động của các thông số này trong dân số, nhà nghiên cứu cần tiến hành
ước lượng khoảng tin cậy với một độ tin cậy xác định – thường là 95% hoặc 99%.
Trong các nghiên cứu y học, nhiều khi một biến số không thể mô tả đầy đủ
một chỉ số lâm sàng nên người ta phải căn cứ vào nhiều biến số. Để biết độ dao
53
động hoặc so sánh các biến số này, cùng với phương pháp KĐ giả thuyết TK, ước
là
lượng khoảng tin cậy là một trong những khâu quan trọng của một nghiên cứu.
là biến cố viêm phổi do virus. Đo nồng độ CRP
Ví dụ 2.1: Để phân biệt viêm phổi do vi trùng hay do virus, người ta đo nồng độ CRP (C-Reactive Protein) (mg/l) trong máu và tìm điểm cắt để chẩn đoán. Gọi B+ biến cố viêm phổi do vi trùng và B-
trong 10 người ở mỗi nhóm ta có kết quả trong bảng 2.1:
Bảng 2.1. Nồng độ CRP
[Nguồn: Nguyễn Ngọc Rạng, 2012]
Nồng độ CRP của nhóm viêm phổi do vi trùng có cao hơn nồng độ CRP của
nhóm viêm phổi do virus không?
Để trả lời câu hỏi này, nhà nghiên cứu phải tiến hành KĐ giả thuyết TK. Cụ
H
:
;
H
0
= µ µ 2
1
:A
> µ µ 2
1
thể, ở đây có hai giả thuyết mà ta phải KĐ để bác bỏ một:
Nhiều kiến thức XS-TK cần thiết cho việc giải bài toán này, nhưng chúng tôi
sẽ không đi sâu phân tích ở đây.
2.1.3. Tương quan và hồi quy
Phương pháp phân tích tương quan và hồi quy cho phép xác định xem một yếu
tố nguy cơ nào đó có gây bệnh cho một cá nhân hoặc cộng đồng hay không. Trong
y học, những phương pháp phân tích hồi quy và tương quan như hồi quy đơn biến,
đa biến, hồi quy logistic,…thường được sử dụng.
Để khảo sát sự tương quan giữa hai biến số định tính, người ta thường sử dụng
phép kiểm chi bình phương, phép kiểm u hoặc phép kiểm chính xác Fisher.
Nếu cần khảo sát tương quan giữa một biến số định lượng và một biến số định
tính, chẳng hạn hàm lượng cholesterol và bệnh B, thì phép kiểm u hoặc phép kiểm t
là cần thiết.
54
Trường hợp cuối cùng là tương quan giữa 2 biến định lượng thì sử dụng
phương pháp hồi quy Pearson (Nguyễn Văn Tuấn, 2007). Để KĐ các giả thuyết TK
trong trường hợp này, các phép kiểm thường được sử dụng là phép kiểm t (nhằm
đánh giá 2 biến có thực sự tương quan không), phép kiểm u (trong bài toán so sánh
các hệ số tương quan), phép kiểm F (dùng để KĐ tính tương thích của phương trình
hồi quy), …
Như vậy trong mọi trường hợp, KĐ giả thuyết TK đều được sử dụng để khảo
sát sự tương quan giữa hai biến số, KĐ các giả thuyết liên quan đến mô hình hồi
quy - tương quan.
2.1.4. Các mô hình nghiên cứu trong y học
Ngoài ý tưởng mới, giá trị khoa học của một nghiên cứu y học thường được
đánh giá qua phương pháp, nhất là phương pháp thiết kế, thu thập và phân tích DL.
Theo Beth Dawson và Robert G.Trapp (2004), các nghiên cứu trong y học thực
chứng đều thuộc một trong ba mô hình: nghiên cứu mô tả, nghiên cứu phân tích,
nghiên cứu thực nghiệm.
2.1.4.1. Nghiên cứu mô tả
Mục đích của nghiên cứu mô tả nhằm xác định rõ bản chất của các sự vật và
hiện tượng. Để thực hiện điều này, nhà nghiên cứu cần phải thu thập và trình bày
DL một cách có hệ thống về tình hình bệnh tật hoặc một vấn đề sức khỏe cụ thể:
men gan ở bệnh nhân viêm gan, lượng HbA1c ở bệnh nhân đái tháo đường, chỉ số
lipid ở bệnh nhân tăng huyết áp, …
Các tri thức XS-TK thường được sử dụng trong nghiên cứu này là so sánh các
trung bình, các tỷ lệ hoặc phân tích tương quan giữa các biến số.
Ví dụ 2.2. Đề tài sau đây thuộc dạng nghiên cứu mô tả và phân tích: “Tương quan
giữa chỉ số khối cơ thể và rối loạn lipid máu ở bệnh nhân tăng huyết áp”
Mục tiêu nghiên cứu: xác định mối tương quan giữa chỉ số khối cơ thể và tình trạng
rối loạn lipid máu ở bệnh nhân tăng huyết áp.
Phương pháp nghiên cứu: nghiên cứu mô tả và phân tích.
Kết luận: Tương quan giữa BMI với rối loạn lipid máu ở bệnh nhân tăng huyết áp là ở
mức tương quan thấp. (Trần Thị Mỹ Loan và tgk, 2009)
55
Các phân tích TK được sử dụng:
- KĐ giả thuyết TK bằng phép kiểm t cho các biến số định lượng và phép kiểm chi
bình phương cho các biến số định tính.
- Tìm tương quan giữa các biến định lượng bằng phương pháp Pearson.
2.1.4.2. Nghiên cứu phân tích
Mục đích của phương pháp này là xác định các nguyên nhân hay các yếu tố
nguy cơ của của một bệnh nào đó bằng cách so sánh hai hay nhiều nhóm có đặc tính
X và không có đặc tính X.
Nghiên cứu này có thể chia thành 3 loại chính là nghiên cứu cắt ngang, nghiên
cứu cắt dọc (kể cả đoàn hệ) và nghiên cứu bệnh chứng.
a. Nghiên cứu cắt ngang (cross-sectional study)
Nghiên cứu này được tiến hành tại một thời điểm trong thời gian ngắn với mục
đích ước tính tỷ lệ bệnh lưu hành và các yếu tố liên quan đến bệnh trong một
quần thể.
Ví dụ 2.3. Đề tài “Nồng độ acid uric huyết thanh ở bệnh nhân tăng huyết áp”.
Mục tiêu nghiên cứu: Khảo sát nồng độ acid uric huyết thanh ở bệnh nhân tăng huyết
áp nguyên phát
Đối tượng: Tất cả bệnh nhân tăng huyết áp nguyên phát mới được chẩn đoán hoặc
không được điều trị hạ áp liên tục trước lúc nhập viện, vào khoa tim mạch bệnh viện
GĐ từ tháng 03 đến tháng 09/2007 (và không thuộc bảng tiêu chuẩn loại trừ).
Phương pháp nghiên cứu: mô tả cắt ngang, tiền cứu.
(Hồ Thị Ngọc Dung và tgk, 2009)
Dùng phép kiểm t để so sánh hai trung bình về nồng độ acid uric huyết thanh
của nam và nữ. Kết quả: có sự khác biệt có ý nghĩa TK về nồng độ acid uric huyết
thanh ở nam và nữ (p < 0,001), không có sự khác biệt giữa các lớp tuổi bằng phép
phân tích phương sai (p = 0,003)
b. Nghiên cứu cắt dọc (longtidinal study)
Nghiên cứu cắt dọc nhằm ước tính tỷ lệ phát sinh của bệnh và các yếu tố liên
quan đến bệnh trong một quần thể.
56
Ví dụ 2.4. Đề tài: “Tìm hiểu giá trị nồng độ NT – Pro ANP, MR – Pro AMD trong
chẩn đoán và tiên lượng trên bệnh nhân suy tim”. Tác giả sử dụng phương pháp mô
- Xác định nồng độ NT-proANP ở các giai đoạn A, B, C, D và điểm cắt trong chẩn đoán suy tim.
- Khảo sát mối tương quan giữa NT-proANP với các giai đoạn A, B, C, D
- Khảo sát tương quan giữa NT-proANP trong máu với tình trạng phì đại tâm thất, rung nhĩ
trên điện tâm đồ.
- Khảo sát tương quan giữa nồng độ NT-proANP trong máu với rối loạn chức năng tâm thu,
tâm trương.
- Khảo sát giá trị tiên đoán tử vong của NT-proANP, MR-proADM (Nguyễn Chí Thanh, 2011).
tả cắt dọc với các mục đích sau:
Để giải quyết các vấn đề đặt ra, các phân tích TK được sử dụng:
- Phân tích đường cong Kaplan Meier dự báo khả năng sống còn dựa theo NT – Pro
ANP, MR – Pro ADM
- Phân tích tương quan đa biến tìm xem yếu tố nào ảnh hưởng đến khả năng sống
còn mạnh nhất (EF, NYHA, NT – Pro ANP, MR – Pro ADM, tuổi).
c. Nghiên cứu bệnh - chứng (case control study)
Nghiên cứu này được dùng để tìm hiểu sự liên hệ giữa một yếu tố X và bệnh B
bằng cách so sánh hai trung bình hoặc hai tỷ lệ của nhóm có bệnh và nhóm không
bệnh (nhóm chứng)
Nghiên cứu bệnh - chứng thích hợp với các bệnh hiếm, vì cỡ mẫu nhỏ hơn
nhiều so với nghiên cứu cắt ngang hoặc cắt dọc.
Phương pháp TK được sử dụng trong nghiên cứu: sử dụng phép kiểm u và
phép kiểm t để so sánh hai trung bình, hai tỷ lệ.
Ví dụ 2.5. Một ví dụ về phương pháp nghiên cứu bệnh - chứng là đề tài nghiên cứu:
“Vai trò của C-reactive protein trong chẩn đoán viêm ruột thừa cấp”
Mục tiêu: Xác định vai trò của C-reactive protein (CRP) trong chẩn đoán viêm ruột
thừa (VRT) cấp, tìm ra ngưỡng chẩn đoán và giá trị chẩn đoán tương ứng, xem xét
tương quan giữa nồng độ CRP máu với tình trạng ruột thừa trong mổ cũng như giữa
các triệu chứng lâm sàng và các XN máu với chẩn đoán VRT.
Phương pháp nghiên cứu: nghiên cứu bệnh chứng bắt cặp
(Đặng Quốc Việt và tgk, 2010)
57
Ứng dụng các tri thức về XS-TK trong đề tài như sau:
- Tính XS có điều kiện: độ nhạy, độ chuyên, giá trị tiên đoán âm và giá trị tiên đoán
dương.
- Phương pháp KĐ giả thuyết TK được sử dụng để so sánh tổng số bạch cầu và bạch
cầu đơn nhân trung tính giữa nhóm viêm ruột thừa và nhóm chẩn đoán khác dẫn đến
kết luận số bạch cầu ở nhóm viêm ruột thừa tăng cao hơn trong nhóm chẩn đoán
khác; không có sự khác biệt về số bạch cầu giữa nhóm viêm ruột thừa có biến
chứng và chưa biến chứng.
- Bằng phương pháp hồi quy logistic đa biến, các tác giả đã xây dựng được phương
=
V
ln
trình hồi quy giữa các triệu chứng và VRT là:
VRT VRT
= -0,359 + 0,561A + 2,261B - 0,001C + 0,001D + 0,02E
Trong đó, các triệu chứng là A: chán ăn, B: phản ứng thành bụng, C: tổng số bạch
=
P VRT
(
)
cầu, D: số lượng bạch cầu đa nhân trung tính và E: CRP máu
V e +
V e
1
Từ đó tính được XS VRT của một bệnh nhân là và khẳng định
có sự tương quan thuận giữa CRP trong máu và mức độ viêm ruột thừa. Theo đó,
nếu một bệnh nhân viêm ruột thừa càng nặng thì CRP trong máu càng cao.
2.1.4.3. Nghiên cứu thực nghiệm
Có ba loại nghiên cứu thực nghiệm: Thử nghiệm lâm sàng đối chứng ngẫu
nhiên, thử nghiệm vaccine và thử nghiệm can thiệp.
a. Thử nghiệm lâm sàng đối chứng ngẫu nhiên (Randomized controlled clinical
trial) thường được sử dụng để đánh giá hiệu quả của một phương pháp điều trị, hiệu
quả của một loại thuốc mới. Các đối tượng nghiên cứu được chia thành 2 nhóm.
Nhóm I: nhóm thử nghiệm được can thiệp (sử dụng thuốc mới, hoặc phương pháp
điều trị mới). Nhóm II: nhóm đối chứng (điều trị giả hoặc dùng giả dược - placebo).
Sau đó hai nhóm được theo dõi cùng lúc để xem kết quả giữa hai nhóm có khác
nhau không.
Trong thử nghiệm này, các phương pháp thường được sử dụng là mù đôi
(bệnh nhân và nhà nghiên cứu đều không biết mình được phân vào nhóm nào), mù
58
đơn (chỉ nhà nghiên cứu biết, người tham gia không biết về chế độ điều trị), không
Thử nghiệm lâm sàng đầu tiên trong y học do bác sĩ người Pháp tên là Pierre Louis
được thực hiện vào năm 1836. Trong thử nghiệm này, ông điều trị một nhóm bệnh
nhân bị viêm phổi bằng cách trích nhiều máu và một nhóm bệnh nhân khác được trích
ít máu hơn. Sau đó ông đếm số lượng bệnh nhân chết trong hai nhóm và đưa ra kết
luận là trích nhiều máu là một phương pháp điều trị nguy hiểm.
(Nguyễn Văn Tuấn, 2004)
mù (không thể thực hiện các can thiệp ngoại khoa)
Ví dụ 2.6. Một nghiên cứu thử nghiệm lâm sàng đối chứng ngẫu nhiên “không mù”:
“So sánh Gatifloxacin với Azithromycin trong điều trị thương hàn không biến
chứng ở trẻ em và người lớn tại Việt Nam”
Các phân tích TK được sử dụng trong nghiên cứu này: KĐ chính xác Fisher,
95% khoảng tin cậy cho OR và RR, phân tích sống sót, phương pháp Kaplan-Meier,
Mục tiêu của nghiên cứu là xác định tính an toàn, hiệu quả, sẵn có và chấp nhận được
của các kháng sinh điều trị thương hàn đa kháng và kháng nalidixic acid.
Phân bố đối tượng ngẫu nhiên vào 2 nhóm:
- Nhóm 1: Azithromycin (ZITHROMAX, Pfizer) uống 20mg/kg-1 lần/ngày x 7 ngày.
- Nhóm 2: Gatifloxacin (TEQUIN, Bristol-Myer Squibb) 10mg/kg-1 lần/ngày x 7
ngày.
phép kiểm log-rank và mô hình Cox.
Kết luận: Cả 2 kháng sinh Gatifolxacin và Azithromycin đều có tính an toàn và hiệu
quả cao trong điều trị thương hàn, đặc biệt ở các vùng có bệnh thương hàn đa kháng
thuốc và kháng nalidixic acid cao. Giá thành điều trị 7 ngày của Gatifloxacin rẻ hơn và
bằng 1/3 so với giá thành điều trị của Azithromycin. (Nguyễn Ngọc Rạng, 2012)
b. Thử nghiệm vaccine (Betty R. Kirkwood, 2003)
Thử nghiệm này tương tự thử nghiệm lâm sàng thuốc và các phương pháp
điều trị, chỉ khác biệt ở mục tiêu thử nghiệm là đánh giá hiệu quả của vaccine trong
việc phòng ngừa sự xuất hiện của bệnh. Chủng vaccine là một biện pháp phòng
bệnh, vaccine và giả dược được dùng cho hai nhóm người khỏe mạnh, không phải
cho người bệnh. Nếu vaccine có hiệu lực thì tỷ lệ bệnh trong nhóm dùng giả dược
sẽ cao hơn so với nhóm dùng vaccine.
59
Ví dụ 2.7. Kết quả thử nghiệm vaccine cúm: Trong 460 người lớn có 240 người
được tiêm vaccine và 220 người được tiêm placebo. Trong tổng số 100 người bị
cúm có 20 người trong nhóm vaccine và 80 người ở nhóm placebo.
Câu hỏi đặt ra là: Có đủ chứng cứ để xem vaccine có hiệu quả hay sự khác biệt
là do tình cờ? (xem bảng 2.2)
Bảng 2.2. Kết quả thử nghiệm vaccine cúm
[Nguồn: Betty R. Kirkwood, 2003]
Để trả lời câu hỏi này, phương pháp TK được sử dụng là phép kiểm chi bình
phương dẫn đến kết luận: có sự khác biệt có ý nghĩa TK về hiệu lực phòng cúm
trong nhóm vaccine và nhóm placebo (p < 0,0001).
c. Nghiên cứu can thiệp
Trong nghiên cứu này, nhà nghiên cứu đã có một sự can thiệp trực tiếp vào
nhóm bệnh hoặc cả hai nhóm và so sánh kết quả quan sát trên hai nhóm.
Ví dụ 2.8. Đề tài “Hạ can-xi huyết trong kiềm hô hấp cấp” (Trần Văn Thạch, 2005)
Bằng phương pháp nghiên cứu can thiệp, các tác giả đã so sánh hiệu quả của
hai phương pháp điều trị bằng tái thở vào túi giấy và điều trị thay thế chích tĩnh
mạch can-xi. Bệnh nhân được chia làm hai nhóm: nhóm I được điều trị với chích
tĩnh mạch can-xi, nhóm II điều trị bằng thở vào bao giấy không dùng thuốc. Kết
quả: thời gian (phút) hết triệu chứng nhóm I là 3,8 ± 0,8 và nhóm II là 4,4 ± 1,17.
Để so sánh thời gian trung bình hết triệu chứng hạ can-xi huyết, tác giả sử
dụng phép kiểm t dẫn đến kết luận: Trung bình hai nhóm này khác nhau không có ý
nghĩa TK, tức là hiệu quả của hai phương pháp điều trị như nhau.
60
2.2. THỰC TIỄN SỬ DỤNG XS-TK: MỘT SỐ SAI LẦM TÌM THẤY
Phân tích trên của chúng tôi cho thấy trong mọi công trình nghiên cứu thuộc
lĩnh vực y học đều có sự can thiệp của XS-TK nói chung và KĐ giả thuyết TK
nói riêng.
Trở về với đề tài đào tạo cán bộ y tế của mình, chúng tôi tiến hành xem xét
một số công trình đã công bố để hiểu các tác giả đã sử dụng công cụ XS-TK ra sao.
Điều ngạc nhiên là chúng tôi tìm thấy một số sai lầm khá phổ biến về phương diện
XS-TK. Điều đó góp phần củng cố ghi nhận ban đầu khi chọn đề tài cho luận án:
khó khăn của các nhà nghiên cứu y học mà chúng tôi đã gặp không phải là cá biệt.
Để tìm hiểu về thực trạng sử dụng XS-TK và những sai sót trong các nghiên
cứu y học, chúng tôi đã thực hiện một điều tra dựa trên các đề tài nghiên cứu được
công bố trong thời gian gần đây.
2.2.1. Không đảm bảo nguyên tắc lấy mẫu
Sau khi tính toán cỡ mẫu cần thiết cho nghiên cứu, nhà nghiên cứu cần tiến
hành lấy mẫu. Một trong những nguyên tắc lấy mẫu là phải đảm bảo mẫu được lấy
mang tính đại diện cho dân số. Nếu chỉ lấy mẫu trong một khu vực, một nhóm đối
tượng thì kết quả thu được sẽ không mang tính khách quan và không thể đại diện
cho một quần thể lớn.
Khảo sát một số công trình, chúng tôi thấy trong các nghiên cứu bệnh - chứng,
nhóm bệnh thường được lấy từ số bệnh nhân trong bệnh viện chứ không được lấy
trong dân số.
Ví dụ 2.9: Đề tài nghiên cứu tương quan giữa đột quỵ thiếu máu và các nguy cơ xơ
vữa mạch bao gồm homocysteine huyết tương.
Bằng phương pháp nghiên cứu bệnh - chứng trong đó nhóm bệnh gồm 220
bệnh nhân nhồi máu não điều trị nội trú ở đơn vị đột quỵ và 230 ca chứng. Kết quả:
mức độ homocysteine trung bình trong nhóm bệnh cao hơn nhóm chứng
(p < 0,001). Tỷ lệ tăng homocysteine vừa nhóm bệnh cao hơn nhóm chứng (25,5%
so với 3,9%, p < 0,001).
61
Như vậy, nhóm bệnh trong nghiên cứu này được lấy từ các bệnh nhân nhồi
máu não đang điều trị nội trú ở đơn vị đột quỵ chứ không phải trong dân số.
Trong một số đề tài khác, tác giả tự xác định cỡ mẫu không theo nguyên
tắc nào.
Ví dụ 2.10: Đề tài nghiên cứu về nồng độ Hcy máu.
Bằng phương pháp bệnh - chứng, đề tài này có các mục đích sau:
- Xác định nồng độ Hcy máu ở nhóm bệnh - chứng
- Xác định tỷ lệ tăng nồng độ Hcy máu trung bình ở nhóm bệnh - chứng
- Khảo sát mối tương quan giữa nồng độ Hcy máu với một số yếu tố nguy cơ khác ở
bệnh nhân nhồi máu não cấp.
Nghiên cứu được thực hiện trên nhóm bệnh gồm 50 bệnh nhân được chẩn
đoán nhồi máu não cấp (30 nam, 20 nữ) đang điều trị tại bệnh viện và nhóm chứng
gồm 50 người khỏe mạnh (30 nam, 20 nữ).
Như vậy, trong nghiên cứu này, các tác giả không giải thích lý do tại sao chọn
mẫu gồm 50 đối tượng trong mỗi nhóm.
2.2.2. Bỏ qua điều kiện của các phép kiểm định
Mỗi phép kiểm đều có điều kiện áp dụng khác nhau, nếu vi phạm điều này thì
kết luận rút ra từ các phép kiểm này có thể không có ý nghĩa.
Thế nhưng, một số điều kiện áp dụng thường bị vi phạm bởi nhiều công trình
nghiên cứu. Trong phần mở đầu chúng tôi đã nêu một ví dụ như vậy. Dưới đây là
hai ví dụ khác.
Ví dụ 2.11. Đề tài nghiên cứu về vai trò của CRP trong chẩn đoán
Trong đề tài này, tác giả so sánh nồng độ CRP máu ở người bình thường và ở
bệnh nhân viêm ruột thừa bằng phép kiểm chi bình phương (Chi - squared test) dẫn
đến kết luận nồng độ CRP khác nhau có ý nghĩa TK giữa hai nhóm. Ở đây, nồng độ
CRP là biến số định lượng nên không thể sử dụng phép kiểm chi bình phương để
so sánh.
62
Ví dụ 2.12. Đề tài nghiên cứu đặc điểm lâm sàng và miễn dịch
Tác giả so sánh số lượng tế bào lympho TCD4, TCD8 trong máu trên 28 bệnh
nhân AIDS, thu được kết quả như sau: Số lượng tuyệt đối tế bào TCD4 của bệnh
nhân là: 229 ± 35 tb/ml so với số TCD4 ở nhóm người bình thường khoẻ mạnh là
879 ± 232 tb/ml dẫn đến kết luận lượng tế bào TCD4 giảm có ý nghĩa TK với
p < 0,001.
Số lượng tuyệt đối tế bào TCD8 của bệnh nhân là: 1005 ± 95 tb/ml so với số
TCD8 ở nhóm người bình thường khoẻ mạnh là 659 ±168 tb/ml dẫn đến kết luận
tǎng có ý nghĩa TK với p < 0,001.
Ở đây tác giả đã sử dụng phép kiểm t (Student). Điều kiện sử dụng phép kiểm
này là hai biến cần so sánh có phương sai đồng nhất và DL lấy từ hai dân số có PPC
(Beth Dawson, Robert G.Trapp, 2004).
Với cỡ mẫu n = 28, để so sánh lượng tế bào TCD4 và TCD8 của bệnh nhân
AIDS và người bình thường khỏe mạnh cần phải sử dụng phép kiểm t. Con số đằng
sau dấu ± có thể là độ lệch chuẩn (SD) hoặc sai số chuẩn (SE), nhưng chúng có sự
khác biệt quá lớn (35 so với 232 và 95 so với 168) chứng tỏ phương sai của hai biến
cần so sánh không đồng nhất. Ví dụ 2.13: Đề tài nghiên cứu về chỉ số Na+ trước và sau mổ
Trong nghiên cứu này, 31 bệnh nhân được cắt tuyến tiền liệt qua niệu đạo
bằng bipolar, điều trị u phì đại lành tính tuyến tiền liệt tại bệnh viện. Chẩn đoán xác
định u phì đại lành tính tuyến tiền liệt dựa vào kết quả giải phẫu bệnh. Sự thay đổi huyết sắc tố, Na+ trước và sau mổ (X ± SD) được cho trong bảng 2.3.
Ghi nhận đầu tiên là tác giả đã không giải thích tại sao cỡ mẫu là 31 (không có
công thức nào tính cỡ mẫu xuất hiện trong công trình này).
Bảng 2.3. Hàm lượng huyết sắc tố và Na+ trước và sau mổ
63
Ghi nhận thứ hai là tác giả đã vi phạm điều kiện sử dụng phép kiểm t. Cụ thể
là trong các nghiên cứu bắt cặp trước - sau, để so sánh hai biến số cần phải sử dụng
phép kiểm t hoặc u cho hai mẫu không độc lập (không thể sử dụng cho hai mẫu
độc lập).
Ở đây, trong các tính toán khoảng tin cậy, lý do số bệnh nhân sau mổ giảm 2
người (trước mổ có 31 bệnh nhân, sau mổ chỉ còn 29 bệnh nhân) không được nêu
rõ, nhưng tác giả có đề cập đến 2 trường hợp bị tai biến, biến chứng (1 trường hợp
chảy máu xoang tĩnh mạch trong mổ; 1 trường hợp nhiễm khuẩn niệu sau mổ). Thế
nhưng, để so sánh hai trung bình bằng phép kiểm t ghép cặp trước và sau mổ thì
nhóm bệnh nhân trước và sau mổ phải là một. Nếu 2 bệnh nhân có biến chứng thì
phải loại bỏ trong phần so sánh và chỉ so sánh ghép cặp trên 29 bệnh nhân còn lại.
Trong phần phân tích TK, tác giả so sánh chỉ số huyết sắc tố và Na+ trước và
sau mổ (trong vòng 1 ngày đầu) nhận thấy: huyết sắc tố giảm có ý nghĩa TK so với trước mổ (p < 0,05), trong khi Na+ lại giảm không đáng kể so với trước mổ
(p > 0,05).
Trong phần phương pháp nghiên cứu, tác giả có đề cập việc so sánh các chỉ số
trung bình bằng phép kiểm t, nhưng trong phần phân tích số liệu TK thì không cho
biết đã sử dụng phép kiểm t khi số liệu ghép cặp hay khi 2 mẫu độc lập. Tuy nhiên,
căn cứ vào giá trị p và số bệnh nhân trước và sau mổ khác nhau nên người đọc có
thể thấy tác giả đã sử dụng phép kiểm t đối với 2 mẫu độc lập. Điều này không
chuẩn về phương pháp TK vì cần phải so sánh 2 trung bình khi số liệu ghép cặp
trước và sau mổ, tức là chỉ thực hiện trên một nhóm bệnh nhân nhưng mỗi bệnh
nhân được đo các chỉ số 2 lần trước và sau mổ, không thể dùng phương pháp so
sánh hai trung bình thực nghiệm độc lập.
Có trường hợp cần sử dụng phương pháp KĐ ghép cặp trước - sau thì tác giả
lại sử dụng phép kiểm chi bình phương trong phân tích TK. Chẳng hạn trong một
nghiên cứu về tác dụng điều trị viêm dạ dày, các tác giả so sánh tình trạng viêm (5
thứ bậc: viêm nông, viêm teo nhẹ, viêm teo vừa, viêm teo nặng, và niêm mạc bình
thường) trong một nhóm bệnh nhân trước và sau điều trị. Kết quả nghiên cứu được
64
phân tích bằng phép kiểm chi bình phương với 3 bậc tự do. Việc sử dụng phép kiểm
chi bình phương trong dạng nghiên cứu này là không hợp thức, vì DL thu thập trước
và sau điều trị không độc lập với nhau. (Nguyễn Văn Tuấn, 2012)
2.2.3. Biến đổi và phân nhóm biến số không theo quy luật
Trong nhiều nghiên cứu, tác giả chia biến liên tục thành nhiều nhóm khác
nhau hoặc biến đổi đến một đơn vị khác nhau không theo quy tắc phân nhóm trong
TK và cũng không có lý do lâm sàng nào rõ ràng. Việc phân chia này có thể làm
ảnh hưởng đến kết quả nghiên cứu vì khi phân nhóm không đúng nguyên tắc TK
chắc chắn sẽ bị mất mát thông tin và dẫn đến những kết luận không chính xác.
Chẳng hạn biến số độ tuổi của các đối tượng nghiên cứu là một biến số liên tục
nhưng thường được chia thành nhiều nhóm khác nhau, có đề tài chia nhóm 5 tuổi
như 30 - 35, 35 - 40, 40 - 45, … nhưng có đề tài lại chia nhóm 10 tuổi như 30 - 40,
40 - 50, … Đặc biệt, có một số đề tài tác giả chia nhóm tuổi không thống nhất như
đề tài “Đánh giá hiệu quả điều trị miễn dịch đặc hiệu ở bệnh nhân viêm mũi dị
ứng". Trong đề tài này, các tác giả chia thành nhiều nhóm tuổi: 9 tuổi, 10 tuổi và có
nhóm được chia thành 17 tuổi:
Đề tài được thực hiện với cỡ mẫu là 40 bệnh nhân được chẩn đoán viêm mũi
dị ứng với dị nguyên D.pte. Tác giả phân nhóm tuổi như sau:
từ 9 - 19 tuổi: 13 bệnh nhân (32,5 %), từ 20 - 29 tuổi: 3 bệnh nhân (7,5 %), từ 30 -
39 tuổi: 10 bệnh nhân (25 %), từ 40 - 49 tuổi: 8 bệnh nhân (20 %), từ 50 - 67 tuổi: 6
bệnh nhân (15%).
Tuổi là một biến số liên tục, nếu phân thành nhiều nhóm không đảm bảo đúng
nguyên tắc TK thì các thông tin suy luận từ việc phân nhóm này sẽ không đáng
tin cậy.
2.2.4. Sai sót trong phân tích tương quan
Trong phân tích tương quan, sự tương quan giữa một yếu tố nguy cơ và bệnh
chịu ảnh hưởng của các nhân tố sau đây:
65
- Những sai lệch trong quá trình lấy mẫu và thu thập DL. Đây là những sai lệch có
hệ thống mà nhà nghiên cứu không thể kiểm soát được trong quá trình phân tích
DL.
- Những yếu tố gây nhiễu (hoặc gây nhầm lẫn) là những biến độc lập vừa liên hệ
với một biến độc lập khác và cùng ảnh hưởng lên biến phụ thuộc. Các yếu tố này
tương tự như yếu tố nguy cơ nhưng có thể kiểm soát được trong quá trình phân
tích DL.
- Những yếu tố làm thay đổi hiệu quả tương quan là sự ảnh hưởng giữa các biến độc
lập nhưng không ảnh hưởng trực tiếp lên biến phụ thuộc. Đây là những yếu tố tương
tự yếu tố gây nhiễu, tạo nên hiệu quả tương quan khác nhau trong những nhóm
khác nhau.
Như vậy, trong phân tích tương quan, nhà nghiên cứu cần phải kiểm soát và
phân biệt yếu tố gây nhiễu và yếu tố thay đổi hiệu quả tương quan. Nếu không thực
hiện điều này thì sẽ dẫn đến một kết luận sai hoặc không đáng tin cậy về sự
tương quan.
Chẳng hạn một nghiên cứu hồi cứu về mối liên hệ giữa bệnh nhồi máu cơ tim
và việc dùng thuốc ngừa thai đã kết luận có sự tương quan giữa hai yếu tố này. Tuy
nhiên, tác giả không nhắc đến một yếu tố làm thay đổi hiệu quả tương quan đó là
“hút thuốc lá” vì rằng “hút thuốc lá làm tăng nguy cơ nhồi máu cơ tim ở những phụ
nữ dùng thuốc ngừa thai”. (Lê Trường Giang, 2007)
Ngoài ra, việc chia đối tượng nghiên cứu trong từng lớp quá nhỏ thì kỹ thuật
phân tích tương quan sẽ không đủ mạnh để có thể có được một kết luận có ý
nghĩa TK.
Chẳng hạn một nghiên cứu về mối tương quan giữa độ tuổi và chỉ số BMI kết
luận rằng có sự tương quan thuận giữa hai biến số này ở toàn bộ đối tượng được
khảo sát với hệ số tương quan R = 0,69. Tuy nhiên khi phân thành nhiều nhóm nhỏ
với các độ tuổi khác nhau thì các hệ số tương quan rất thấp, thậm chí một số nhóm
hầu như không có tương quan với R gần như bằng 0. Đây là một sai lầm khá phổ
biến trong các phân tích tương quan vì khi một biến số bị phân chia thành nhiều
66
đoạn thì khoảng cách giữa giá trị nhỏ nhất và lớn nhất của dãy số (range) trong từng
nhóm có sự khác biệt lớn, độ phân tán của DL lớn nên hệ số tương quan trong các
nhóm nhỏ này cũng giảm. Điều đặc biệt quan trọng là khi chia nhỏ DL quan sát thì
cỡ mẫu trong mỗi nhóm khá nhỏ nên các suy diễn từ mẫu nhỏ có thể sẽ không còn
đúng cho dân số lớn.
Trong phân tích tương quan tuyến tính đơn biến, mô hình hồi quy của Pearson
chỉ có giá trị khi các điều kiện sau đây phải thỏa mãn:
- Các biến số độc lập (x) là biến cố định và không có sai sót trong đo lường;
- Phần dư (hiệu số của giá trị quan sát và giá trị dự báo) phải tuân theo PPC;
- Không có tương quan giữa các phần dư.
Rất nhiều nghiên cứu có sử dụng mô hình hồi quy tuyến tính không có phần
kiểm tra các điều kiện này, và cũng không có phần nào nói về những điều kiện này.
2.2.5. Ý nghĩa thống kê và ý nghĩa lâm sàng
Trong một công trình nghiên cứu, để phản ánh tình trạng của bệnh nhân,
không thể chỉ dựa vào một chỉ số lâm sàng mà có thể cần đến nhiều biến số. Nếu số
lượng biến số càng nhiều thì nhà nghiên cứu càng có nhiều cách phân nhóm bệnh
nhân theo các tiêu chí khác nhau như: độ tuổi, giới tính, cân nặng, mức độ bệnh và
như vậy, nhà nghiên cứu có thể phân thành nhiều nhóm nhỏ để phân tích. Trong
một số trường hợp, kết quả phân tích có thể có ý nghĩa TK (p < 0,05) nhưng không
có ý nghĩa lâm sàng.
Chẳng hạn như một nghiên cứu về mối liên hệ giữa lipid và chứng cao huyết
áp, các nhà nghiên cứu đo lường 4 chỉ số lipid như tổng số cholesterol, LDL
cholesterol, HDL cholesterol, và triglycerides trong hai nhóm đối tượng nam và nữ
(nhóm cao huyết áp và nhóm bình thường) tuổi từ 40 đến 70 tuổi. Họ chia các đối
tượng thành 3 nhóm tuổi theo giới tính, cộng với hai nhóm đối tượng thành
12 nhóm nhỏ khác nhau và có thể thực hiện 66 phân tích so sánh. Mỗi so sánh, họ
có thể lặp lại 4 lần (cho 4 chỉ số lipid). Sau khi phân tích trên nhiều nhóm và lặp lại
nhiều lần, các nhà nghiên cứu phát hiện rằng chỉ có triglycerides là khác biệt giữa
nam và nữ, và sự khác biệt này chỉ tìm thấy trong nhóm đối tượng tuổi từ 40 đến 49
67
và chỉ trong nữ giới thuộc nhóm bình thường. Nói cách khác, các nhà nghiên cứu đã
đi ra ngoài mục đích ban đầu của nghiên cứu, và phát hiện được một khác biệt mà
câu hỏi “tại sao” vẫn chưa thể trả lời bằng lí giải sinh học. (Nguyễn Văn Tuấn, 2012)
Trong một số nghiên cứu có chỉ số p > 0,05, theo quy tắc KĐ thì có thể kết
luận sự khác biệt giữa hai nhóm không có ý nghĩa TK. Không chấp nhận điều này,
các tác giả chia DL thành nhiều nhóm nhỏ theo các tiêu chí khác nhau như: độ tuổi,
giới tính, mức thu nhập, … và thực hiện KĐ nhiều giả thuyết cho đến khi phát hiện
một giả thuyết mà kết quả KĐ có ý nghĩa TK.
Phương pháp KĐ giả thuyết TK dựa vào giá trị p vẫn còn nhiều khiếm khuyết
và tranh cãi vì tính không logic của nó, nhưng hiện tại chưa có một phương pháp
nào tốt hơn nên trong hầu hết các công trình, nhà nghiên cứu vẫn sử dụng giá trị p
để kết luận có ý nghĩa TK hay không. Nếu p < 0,05 thì kết luận sự khác biệt có ý
nghĩa TK và ngược lại. Tuy nhiên, ý nghĩa TK không tương đương với ý nghĩa lâm
sàng. Trong nhiều nghiên cứu, một sự khác biệt rất nhỏ nhưng vẫn có ý nghĩa TK
(chẳng hạn p = 0,049) nhưng chưa hẳn đã có ý nghĩa lâm sàng. Ngược lại, có một số
nghiên cứu, kết quả có ý nghĩa lâm sàng nhưng do giá trị p > 0,05 nên tác giả kết
Chẳng hạn một nghiên cứu về hiệu quả của việc bổ sung vitamin C và E ở phụ nữ
mang thai, các nhà nghiên cứu kết luận rằng việc bổ sung vitamin C và E không làm
giảm các triệu chứng lâm sàng nghiêm trọng với p = 0,06 nhưng khi xem xét số liệu
thực tế thì thấy ở trẻ em mà mẹ có bổ sung vitamin C và E thì tỷ lệ giảm triệu chứng
lâm sàng là 21%. Vì p = 0,06 > 0,05 nên các nhà nghiên cứu đã diễn dịch sai kết quả
và đây là sai lầm nghiêm trọng. (Nguyễn Văn Tuấn, 2012)
luận không có ý nghĩa lâm sàng.
2.2.6. Thiết kế nghiên cứu không có nhóm chứng
Các nghiên cứu được thực hiện trên hai nhóm đối tượng dùng để so sánh
hiệu quả của một loại thuốc hoặc một phương pháp điều trị mới. Nhóm 1 sử dụng
thuốc mới hoặc phương pháp điều trị mới, nhóm 2 (nhóm chứng) sử dụng giả dược
(placebo) hoặc điều trị giả. Việc phân chia các đối tượng thành 2 nhóm là rất quan
trọng vì nếu không có nhóm đối chứng thì hiệu quả điều trị sẽ không đánh giá được
vì có một số bệnh nhân tự khỏi bệnh mà không cần điều trị.
68
Ví dụ 2.14: (Moore DS, McCabe GP, 2006). Một nghiên cứu về hiệu quả giảm đau
bằng nước đá lạnh cho các bệnh nhân bị viêm loét dạ dày không có nhóm đối
chứng, các nhà nghiên cứu đã khẳng định bằng cách bơm nước đá lạnh vào dạ dày
những bệnh nhân bị viêm loét sẽ giảm tiết acid và giảm đau. Tuy nhiên, nhiều năm
sau, một nghiên cứu lâm sàng có nhóm đối chứng cho thấy điều ngược lại. Trong
nghiên cứu này, các nhà nghiên cứu chia bệnh nhân thành hai nhóm, nhóm 1 cho sử
C. Kết quả cho thấy nhóm 2 có kết quả giảm đau nhiều hơn nhóm 1.
dụng phương pháp bơm nước đá lạnh vào dạ dày như cũ, nhóm 2 được bơm nước nóng 370
Ví dụ 2.15: Đề tài nghiên cứu về Homocyteine huyết thanh.
Đây là đề tài nghiên cứu không có nhóm chứng nên chưa thể kết luận được
việc tăng Homocyteine là một yếu tố nguy cơ độc lập của bệnh thiếu máu não mà
chính tác giả cũng khẳng định điều này trong phần kết luận của đề tài: “Đây là
nghiên cứu tiền cứu bệnh nhân đột quỵ thiếu máu có nguồn gốc do huyết khối động
mạch cho thấy có sự tăng trung bình homocystenie trong máu các bệnh nhân thiếu
máu não và có sự phối hợp mảng xơ mỡ động mạch cảnh trên bệnh nhân tăng
homocysteine. Tuy nhiên cỡ mẫu quá ít và không có đối chứng, để kết luận tăng
homocysteine là một yếu tố nguy cơ độc lập thiếu máu não cần có một nghiên cứu
rộng lớn hơn và có đối chứng”
Nghiên cứu này khảo sát 100 bệnh nhân (59 nam và 41 nữ), tuổi từ 37 đến 87,
nhập vào đơn vị đột quỵ của bệnh viện. Bệnh nhân cung cấp yếu tố nguy cơ mạch
máu và tiền sử mạch máu, mẫu máu lúc đói phân tích sinh hóa mức độ
homocysteine huyết thanh .
Kết quả nghiên cứu: Hyperhomocysteinemia 62/100 (62%), tăng
homocysteine nhẹ 30% (12,0 –15,1 (mol/l)) trong khi tăng vừa là 32% (>15(mol/l)),
homocysteine huyết thanh trung bình của bệnh nhân đột quỵ 13,878 ( 5,302(mol/l)).
Kết luận: Tăng vừa homocysteine là có phối hợp với đột quỵ thiếu máu, 60%
trong nhóm bệnh nhân đột quỵ thiếu máu và có sự phối hợp giữa nồng độ
homocysteine và mảng xơ mỡ động mạch cảnh.
69
2.3. XS-TK TRONG CHẨN ĐOÁN – ĐIỀU TRỊ
Nếu như qua hai phần trên chúng tôi đã chỉ ra vai trò quan trọng của công cụ
XS-TK trong nghiên cứu y học và những sai lầm liên quan đến việc sử dụng công
cụ này được tìm thấy trong không ít công trình, thì phần tiếp theo dành cho việc
xem xét tác động của công cụ này ở khía cạnh chẩn đoán – điều trị bệnh.
Ngày nay, nhiều nghiên cứu điều tra cơ bản, nghiên cứu can thiệp hoặc nghiên
cứu giải pháp công nghệ của y học đều được toán học hóa để có thể sử dụng công
cụ toán học nhằm tìm ra những kết quả đáng tin cậy, có cơ sở. Nếu các vấn đề được
bao quát cả hai mặt định tính và định lượng thì sẽ có những giải pháp ưu tiên,
những can thiệp kịp thời và hiệu quả. Như vậy cần thiết phải phân tích và so sánh
nhiều số liệu quan sát để tìm ra quy luật, từ đó đề ra các giải pháp thiết thực và có
hiệu quả để bảo vệ sức khỏe con người.
Bản thân từ “chẩn đoán” đã toát lên nghĩa XS của nó. Theo từ điển Tiếng Việt,
chẩn đoán có nghĩa là “xác định bệnh dựa theo triệu chứng và kết quả xét nghiệm”.
Chẩn đoán là một trong những công việc được thực hiện hàng ngày của bác sĩ. Khi
một đối tượng có những triệu chứng khác thường, họ sẽ đến bác sĩ để khám bệnh.
Trong quá trình khám bệnh, bác sĩ đã nghi ngờ đối tượng bị bệnh B nào đó với XS
ban đầu, do bác sĩ nhận định, gọi là XS tiền nghiệm. Nếu những triệu chứng của
bệnh nhân không rõ ràng và chưa thể xác định được bệnh nhân có bị bệnh hay
không, và nếu bị bệnh thì đó là bệnh gì, bác sĩ sẽ chỉ định một hoặc một số thủ tục y
khoa (XN, siêu âm, X quang, nội soi, …), gọi chung là XN, với hy vọng kết quả của
các XN mang lại sẽ giúp ích cho chẩn đoán. Với mục đích đó, bác sĩ cần phải chọn
một (hay một số) XN phù hợp. Một trong những căn cứ để lựa chọn là độ chính xác
của XN, giá trị tiên đoán dương, giá trị tiên đoán âm. Đây chính là các XS có
điều kiện.
2.3.1. Độ chính xác của một XN
Trong kỹ thuật y học, một XN T thể hiện độ mạnh bằng hai thông số: độ nhạy
(sensitivity, ký hiệu là ss) và độ chuyên (specificity, ký hiệu là sp), được định nghĩa
như sau:
70
+
= ss P T
(
B+ /
)
- Độ nhạy (hay dương thật) là khả năng XN cho kết quả dương tính đối với những
người bị bệnh B, tức là .
−
= sp P T
(
B− /
)
- Độ chuyên (hay âm thật) là khả năng XN cho kết quả âm tính đối với những người
+
−
T T B
,
,
+ và B− lần lượt chỉ các biến cố:
không bị bệnh B, tức là .
Trong định nghĩa trên, các kí hiệu
XN T cho kết quả dương tính, âm tính, người được chỉ định XN có bệnh và không
có bệnh.
Để đánh giá độ chính xác của một XN, người ta còn sử dụng khái niệm âm giả
và dương giả được định nghĩa như sau:
P T (
B− /
- Âm giả là khả năng XN cho kết quả âm tính đối với người bị bệnh B và được
+ )
diễn tả theo XS có điều kiện là
P T (
B+ /
- Dương giả là khả năng XN cho kết quả dương tính đối với người không bị
− )
bệnh B và được diễn tả theo XS có điều kiện là
P T (
B− /
P T (
B+ /
Dựa vào tính chất của XS, ta có:
+ = 1 - )
+ )
P T (
B+ /
P T (
B− /
Âm giả =
− = 1 - )
− )
Dương giả =
Bản thân các công thức nêu trong định nghĩa khái niệm độ nhạy, độ chuyên,
P T (
B+ /
P T (
B− /
âm giả, dương giả đã cho ta thấy sự can thiệp của XS ở đây. Vấn đề là làm thế nào
+ , )
− . Câu trả lời đến ngay: chúng là các XS có )
để tính các XS
điều kiện nên ta có thể sử dụng công thức Bayes. Nhưng làm sao để có được các XS
thành phần trong công thức này ? Trong y học, câu trả lời là dựa vào một (hay một
số) mẫu được chọn một cách thỏa đáng. Ta nhìn thấy ngay ở đây sự can thiệp của
khoa học TK toán.
Chẳng hạn, để chẩn đoán một đối tượng nghi ngờ bị đái tháo đường, bác sĩ có
thể chỉ định cho đối tượng đó XN nước tiểu hoặc đo nồng độ đường trong máu.
Loại XN thứ hai được xem là XN chuẩn (nếu kết quả XN máu là dương tính thì đối
tượng coi như bị bệnh và sẽ được điều trị, nếu XN máu âm tính thì coi như không
có bệnh). Nhưng loại XN thứ hai mang tính xâm lấn so với loại thứ nhất. Nếu vậy
71
thì phải chăng bác sĩ luôn bắt đầu bằng loại XN thứ nhất ? Câu trả lời là không hẳn
vậy: chọn XN nước tiểu hay không là tùy thuộc vào chẩn đoán ban đầu của bác sĩ
và độ nhạy, độ chuyên của XN đó.
Độ nhạy và độ chuyên ấy được xác định như thế nào ? Tác giả Nguyễn Văn
Tuấn (2011a) chỉ ra câu trả lời với việc dựa vào một bảng TK trên mẫu 1000 người làm XN nước tiểu. Trong bảng đó người bị (B+) hay không bị (B-) bệnh đái tháo
đường đã được xác định bằng cách đo nồng độ đường trong máu.
[Nguồn: Nguyễn Văn Tuấn, 2011a]
Bảng 2.4. Kết quả XN máu và nước tiểu
+
)
+
+
=
=
=
= ss P T
(
/
B
)
0, 059
Căn cứ vào bảng 2.4 người ta tính được:
+ ( P T B + P B ( )
10 /1000 170 /1000
−
)
−
−
=
=
=
= sp P T
(
/
B
)
0,964
Độ nhạy
− ( P T B − P B ) (
800 /1000 830 /1000
−
+
+
+
= −
P T (
/
B
) 1
P T (
/
B
)
Độ chuyên
+
−
−
−
= −
/
) 1
/
)
( P T
B
( P T
B
= 1 - 0,059 = 0,941 Âm giả =
= 1 - 0,964 = 0,036 Dương giả =
Kết quả nêu trên cho thấy XN nước tiểu có độ nhạy khá thấp (chỉ khoảng 6
%), âm giả khá cao. Ngược lại, XN này có độ chuyên cao (khoảng 96 %) và dương
giả rất thấp. Điều này chứng tỏ XN nước tiểu rất có lợi trong việc xác định một cá
nhân không bị bệnh đái tháo đường nhưng không có lợi trong việc khẳng định một
cá nhân bị bệnh đái tháo đường. Vậy thì bác sĩ chỉ chọn XN nước tiểu khi ông ta
chẩn đoán XS không bị bệnh của người đến khám cao hơn XS bị bệnh.
72
2.3.2. Giá trị tiên đoán
Các thông số liên quan đến độ chính xác của một XN chỉ cho chúng ta biết
khả năng XN dương tính hoặc âm tính, không cho biết ngay XS bị bệnh hay không
bị bệnh của một cá nhân. Nhưng dựa vào đó người ta có thể đưa ra XS bị hay không
bị bệnh. Đây là các XS đưa ra sau khi có kết quả XN nên được gọi là XS hậu
nghiệm hay giá trị tiên đoán (Predictive Value, ký hiệu là PV). Người ta định nghĩa:
+
+
=
(
/
)
PV
+ P B T
- Nếu XN T dương tính (ký hiệu T + ), ta có khái niệm giá trị tiên đoán dương:
. Đây chính là khả năng bị bệnh B nếu XN T dương tính.
−
−
=
PV
− P B T
(
/
)
- Nếu XN T âm tính (ký hiệu T − ), ta có khái niệm giá trị tiên đoán âm:
. Đây chính là khả năng không bị bệnh B nếu XN T âm tính.
PV PV+ ,
− . Ngoài ra, XS-TK còn cung cấp thêm những công cụ khác nữa để
Định nghĩa trên cho thấy ngay công thức Bayes cho ta một phương pháp để
tính
tính các giá trị tiên đoán. Để tránh đi quá sâu vào y học cũng như vào XS-TK,
chúng tôi không trình bày các phương pháp này ở đây. Phần Phụ lục 1 sẽ mang lại
một trình bày chi tiết, cho phép thấy XS-TK ảnh hưởng như thế nào vào việc giải
quyết vấn đề tính các giá trị tiên đoán.
PV PV+ ,
Nếu có nhiều XN để hỗ trợ chẩn đoán một bệnh thì bác sĩ phải lựa chọn XN
− cho thấy:
nào ? Các công thức tính
PV + cao (giá trị cao nhất là 1), do đó phải chọn XN có độ chuyên cao.
- Muốn khẳng định bệnh khi XN dương tính thì cần giá trị tiên đoán dương
- Muốn loại trừ bệnh khi XN âm tính thì cần giá trị tiên đoán âm PV − cao (giá
trị cao nhất là 1). Do đó phải chọn XN có độ nhạy cao.
2.3.3. Mô hình ngưỡng
Khái niệm mô hình ngưỡng cho chúng ta thêm một ví dụ về vai trò của XS-
TK trong chẩn đoán và điều trị.
Phát hiện thấy một triệu chứng không bình thường liên quan đến sức khỏe của
mình, người bệnh đến gặp bác sĩ. Sự có mặt của triệu chứng này cùng với tỷ lệ mắc
bệnh trong cộng đồng ở thời gian đó, rồi kinh nghiệm của bác sĩ, … khiến ông nghĩ
có thể người đến khám đã mắc bệnh B. Nhưng những căn cứ đó chưa đủ để có thể
73
khẳng định chắc chắn là bệnh nhân có bệnh. Bác sĩ phải làm gì ? XN là một trong
những công cụ quan trọng giúp bác sĩ đưa ra quyết định điều trị hay không. Tuy
nhiên, cũng không thể quyết định ngay là làm XN và làm XN gì, bởi vì việc chỉ
định một XN không cần thiết hoặc chỉ định sai XN sẽ gây tốn kém về chi phí, thậm
chí có thể gây nên hậu quả xấu cho tình trạng sức khỏe bệnh nhân. Ngoài ra, việc
chỉ định quá nhiều XN có thể làm cho quyết định của bác sĩ trở lên khó khăn hơn vì
nhiễu thông tin hoặc có những XN cho kết quả trái ngược. Do đó, việc lựa chọn các
XN cần làm đóng một vai trò quan trọng trong chẩn đoán và điều trị.
Trước khi chỉ định làm một XN T nào đó, bác sĩ đã đưa ra một XS P(B+), gọi là XS tiền nghiệm để đánh giá XS mắc bệnh B của người đến khám. Giá trị P(B+)
thuộc [0; 1], thường được các bác sĩ đưa ra trong thực hành ở dạng phần trăm. Giá
trị này có thể dựa vào kinh nghiệm của bác sĩ, dựa vào tỷ lệ bệnh lưu hành trong
cộng đồng hoặc TK của phòng khám. Đoạn [0; 1] được chia thành ba vùng: theo
dõi, XN, điều trị. Các mốc phân chia được ký hiệu là Tt và Tγ, gọi là các ngưỡng -
Tt là ngưỡng XN, Tγ là ngưỡng điều trị. - Nếu P(B+) < Tt thì bác sĩ sẽ chưa chỉ định XN và cũng không điều trị mà chỉ để theo dõi bệnh nhân. - Nếu P(B+) > Tγ thì bác sĩ sẽ quyết định điều trị ngay, XN T là vô ích. - Nếu Tt < P(B+) < Tγ thì bác sĩ sẽ chỉ định thực hiện XN T (và những XN khác nữa
nếu thấy cần) để giúp cho việc chẩn đoán.
Mô hình gồm các ngưỡng này do Pauker và Kassier đưa ra vào năm 1980 và
do đó nó còn được gọi là mô hình ngưỡng P-K (xem hình 2.1).
Hình 2.1. Mô hình ngưỡng P - K
Điều quan trọng là phải xác định được hai ngưỡng Tt, Tγ. Một cách xác định
mà các bác sĩ thường sử dụng là căn cứ vào tính chất của XN. Đối với bệnh mà việc
thực hiện XN đơn giản, không xâm lấn (chẳng hạn bệnh viêm dạ dày), ít tốn kém về
74
thời gian và kinh phí thì bác sĩ thường dễ dàng chỉ định XN - khi đó vùng XN rộng
ra, vùng điều trị hẹp lại. Đối với những bệnh mà việc làm XN mang tính xâm lấn
(chẳng hạn bệnh ung thư), tốn kém về thời gian và kinh phí thì bác sĩ ít chỉ định
XN, khi đó vùng điều trị rộng ra, vùng XN hẹp lại. Cách làm này rõ ràng là mang
tính chủ quan, không thực sự mang lại một đánh giá tin cậy cho các ngưỡng.
Thực ra, có thể tránh tính chủ quan của phương pháp trên bằng cách sử dụng
− 1
− 1
+
−
=
+
=
+
LR .
;
LR .
T γ
T t
B R
B R
1
1
công thức sau để tính Tt, Tγ :
trong đó R là tỷ lệ gây rủi ro (Risk) và B (Benefits) là tỷ lệ lợi ích của việc điều trị. Các giá trị LR+, LR- tính được nhờ các công thức của XS mà chúng tôi có trình bày
trong phần Phụ lục 1.
Trên đây là ba loại ứng dụng phổ biến của XS-TK trong chẩn đoán và điều trị
bệnh. Còn có những ứng dụng phức tạp hơn, nhưng chúng tôi sẽ không đi sâu trình
bày chi tiết.
2.4. MỘT NGHIÊN CỨU THỰC TIỄN DẠY HỌC MÔ HÌNH NGƯỠNG
Như vậy, không chỉ trong các nghiên cứu, mà trong chẩn đoán và điều trị XS-
TK cũng đóng vai trò quan trọng. Vậy kỹ năng sử dụng công cụ XS-TK được hình
thành như thế nào cho các bác sĩ tương lai ? Chúng tôi sẽ chọn ngay mô hình
ngưỡng để làm đối tượng tri thức Q và nghiên cứu xem nó đã được đưa vào ra sao
trong dạy học ở Đại học Y Dược Tp HCM. Các khái niệm quan hệ thể chế đối với
Q, tổ chức toán học, tổ chức didactic sẽ được sử dụng ở đây. Cụ thể, trước hết
chúng tôi sẽ làm rõ những praxéologie cần dạy thông qua phân tích cuốn giáo trình
XS-TK do một nhóm GV của trường biên soạn và được sử dụng ở trường này. Để
thuận tiện, chúng tôi dùng ký hiệu V1 để chỉ cuốn giáo trình. Sau đó, chúng tôi sẽ
quan sát giờ dạy của một GV để tìm hiểu những praxéologie được dạy cho SV.
2.4.1. Các praxéologie cần dạy
Khi phân tích các praxéologie cần dạy, chúng tôi thường chỉ dừng ở việc xác
định yếu tố công nghệ mà không đi đến chỗ làm rõ thành phần lý thuyết của chúng.
75
Hiển nhiên, lý thuyết XS cũng như các kiến thức của y học là một tham chiếu quan
trọng phải nói đến khi cần xác định thành phần này
Mô hình ngưỡng được trình bày trong chương cuối cùng Xác suất trong chẩn
đoán của giáo trình V1. Phân tích của chúng tôi đã chỉ ra rằng các praxéologie liên
quan đến mô hình ngưỡng được tổ chức quanh bốn kiểu nhiệm vụ mà chúng tôi ký
hiệu là TĐG, TXĐ, TT, TQĐ. Đó là:
TĐG: Đánh giá XS tiên nghiệm
TXĐ: Xác định các ngưỡng Tt và Tγ
TT: Tính XS hậu nghiệm
TQĐ: Đưa ra quyết định trong chẩn đoán.
Từ những gì được trình bày ngắn gọn về mô hình ngưỡng ở trên, ta thấy TĐG,
TXĐ, TT, là những kiểu nhiệm vụ con của TQĐ. Điều đó sẽ được giải thích rõ hơn ở
phía dưới khi chúng tôi phân tích các kỹ thuật được đưa vào trong V1.
• TĐG: Đánh giá XS tiên nghiệm P(B+)
Kỹ thuật τĐG được trình bày như sau trong V1: dự đoán XS tiên nghiệm (nghĩa
là đánh giá XS bệnh nhân bị bệnh B) bằng cách khám lâm sàng và hỏi bệnh sử.
Công nghệ θĐG giải thích cho τĐG được V1 trình bày rất đơn giản: Trong y học, XS P(B+) được dự đoán bằng cách dựa vào một mặt là tỷ lệ bệnh đang lưu
hành hoặc thống kê của phòng khám, mặt khác là kinh nghiệm của bác sĩ.
• TXĐ: Xác định ngưỡng
- τXĐ: Dựa vào bản chất bệnh hoặc tính chất các yếu tố như độ rủi ro, chi phí, mức
độ làm sáng tỏ của XN T, lợi ích hay bất lợi của việc điều trị tùy theo người bệnh có
bệnh hay không, …
XĐE giải thích
Trong giáo trình V1, kỹ thuật để giải quyết TXĐ và công nghệ θ
"Vị trí của Tt và Tγ thay đổi, tùy thuộc vào nhiều yếu tố: XN có độ rủi ro cao hay thấp,
chi phí thấp hay cao, chính xác nhiều hay ít, và lợi hại của việc điều trị nếu bệnh nhân có
bệnh B hay không.
cho kỹ thuật đó không thể tách rời, như trích dẫn dưới đây đã nêu:
76
Hai giá trị Tt và Tγ chia đoạn (0, 1) thành ba vùng: vùng không điều trị, vùng XN, vùng
điều trị. Mức độ rộng hẹp của vùng này tùy thuộc vào hai giá trị Tt và Tγ, tức là tùy theo
XN T và lợi ích điều trị bệnh B.
Trường hợp XN khá chính xác, ít rủi ro và ít tốn kém, bác sĩ thường cho làm XN đó, dù
khả năng bị bệnh của bệnh nhân cao hay thấp: vùng test rộng ra. Trái lại, nếu XN ít chính
xác hoặc lắm rủi ro thì bác sĩ không muốn chỉ định XN đó: vùng test hẹp lại." (Chu Văn
Thọ và tgk, 2008, tr. 219)
• TQĐ: Ra quyết định lâm sàng trong chẩn đoán
Ở đây người ta sử dụng mô hình ngưỡng bằng cách dựa vào XS p. p có thể là P(B+) hay PA (gọi là XS hậu nghiệm, tính được tùy vào việc kết quả XN - nếu đã
thực hiện - là dương tính hay âm tính), tùy theo ở thời điểm nào của quá trình chẩn
bệnh. Kỹ thuật τXĐ được mô tả như sau:
- Nếu p < Tt: quyết định không cho điều trị
< <
p Tγ
- Nếu p > Tγ: điều trị ngay
tT
- Nếu : chỉ định một XN (nếu p là P(B+) ) hay một XN khác (nếu
p là PA) để đánh giá tốt hơn XS mà người ta có thể gán cho khả năng bệnh nhân
mắc bệnh.
"Mô hình ngưỡng giải thích việc bác sĩ làm XN hay không với việc cho điều trị bệnh B hay
không, là tùy vào p rơi vào vùng nào. Mỗi vùng rộng hay hẹp tùy vào vị trí của
tT và Tγ .
Hai giá trị ngưỡng này tùy thuộc vào:
- Rủi ro, tốn kém và độ chính xác của T.
- Ích lợi và tai hại của việc điều trị bệnh B" (Chu Văn Thọ và tgk, 2008, tr.220)
θQĐ: đây là phần giải thích cho kỹ thuật tìm thấy trong V1:
Như vậy θQĐ là mô hình ngưỡng P – K.
• TT: Tính XS hậu nghiệm
Trong trường hợp đã cho bệnh nhân làm XN T, bác sĩ cần tham khảo kết quả
XN để đánh giá (lần thứ hai) XS người này mắc bệnh B. Nói cách khác, bác sĩ phải
thực hiện kiểu nhiệm vụ T – tính XS hậu nghiệm.
Giáo trình V1 mà chúng tôi phân tích đưa ra ba kỹ thuật để giải quyết kiểu
nhiệm vụ này.
77
P B T+
/
− )
- τT: Dùng công thức Bayes
P B T+
/
+ )
- Nếu T- (kết quả XN T là âm tính): tính p = (
- Nếu T+ (kết quả XN T là dương tính): tính p = (
T giải
/
(
)
=
P B A / )
(
). ( P B P A B P A ) (
thích cho kỹ là công thức Bayes: Công nghệ θ thuật τT
- τ’T: Dùng phương pháp bảng 2 × 2
Bảng 2 × 2 biểu thị độ nhạy và độ chuyên của XN T (hai tham số cho phép
đánh giá mức độ chắc chắn của T). V1 đã đưa vào bốn công thức để tính độ nhạy và
độ chuyên của T.
- τ"T: Dùng phương pháp tỷ cơ hội
+
+
+
+
=
=
LR T (
)
LR A ( )
Tỷ cơ hội của biến cố A, ký hiệu LR(A), được xác định theo công thức
+
−
−
( P T P T (
B B
) )
/ /
P A B / P A B /
( (
) )
−
+
−
=
LR T (
)
. Nếu A là T+ thì , ký hiệu là LR+ nếu A là T -
−
−
P T ( P T (
B B
) )
/ /
, ký hiệu là LR− . thì
Sau đó V1 đưa vào các các công thức tính XS hậu nghiệm. Các công thức đó phụ thuộc vào P(B+), độ nhạy, độ chuyên và kết quả XN. Những kỹ thuật này khá
cồng kềnh nên chúng tôi không đi sâu vào việc giới thiệu chúng.
Tóm lại, có 4 kiểu nhiệm vụ liên quan đến mô hình ngưỡng. Bản chất của
chúng là gì ? TT: là một kiểu nhiệm vụ toán học. Một trong những kỹ thuật để giải
quyết là sử dụng công thức Bayes đã được V1 đưa vào trước đó. TĐG không phải là
kiểu nhiệm vụ toán học dù kỹ thuật τĐG có bao gồm việc so sánh hai số. Ta cũng có
thể nói như vậy đối với TQĐ. TXĐ, theo cách trình bày của V1 cũng không phải là
một kiểu nhiệm vụ toán học. Kỹ thuật τXĐ mà giáo trình đề cập đến là căn cứ vào
các yếu tố như rủi ro, chi phí và độ nhạy của XN mà người ta định chọn với hy vọng
có những thông tin thỏa đáng cho phép khẳng định bênh nhân có bệnh hay không.
Kỹ thuật đó cũng phải tính đến lợi hại của việc điều trị nếu bệnh nhân có bệnh hay
78
không có bệnh, …Chẳng hạn, nếu bệnh đó là ung thư ở giai đoạn cuối thì bác sĩ sẽ
xem rằng khoảng điều trị rất hẹp.
Mô hình của Castelat mang lại một cái nhìn rõ ràng về thành phần công nghệ
bao gồm các yếu tố của y học. Như chúng
của các praxéologie tạo thành từ TĐG, TQĐ, TXĐ. Bởi vì đây là những kiểu nhiệm vụ chẩn bệnh và điều trị nên thành phần θth
tôi đã chỉ ra, trong V1 kỹ thuật và công nghệ của các praxéologie này không tách rời
không mang lại một lời
nhau. Dường như điều đó làm cho kỹ thuật (và cả công nghệ) đều không rõ ràng. Sự không rõ ràng đó lại càng lớn hơn khi mà thành phần θp
giải thích đầy đủ cho kỹ thuật được giới thiệu trong V1 (chẳng hạn, "dựa vào các
yếu tố như độ nguy hiểm, chi phí XN và mức độ làm sáng tỏ của XN,…" để xác định
các ngưỡng). Chúng tôi tự hỏi phải chăng đây là nguồn gốc khó khăn của SV
y khoa.
− 1
− 1
+
−
=
+
=
+
LR .
;
LR .
T γ
T t
B R
B R
1
1
Thực ra thì lý thuyết XS cung cấp cho ta công thức để tính như sau:
trong đó R là tỷ lệ gây rủi ro (Risk) và B (Benefits) là tỷ lệ lợi ích của việc điều trị.
Như thế, praxéologie gắn liền với TXĐ đã không được thiết lập một cách đầy
đủ: kỹ thuật toán học không được đưa vào trong giáo trình. Hệ quả là SV thiếu
những kỹ thuật thỏa đáng để chẩn đoán và điều trị cho bệnh nhân.
2.4.2. Phân tích thực tế DH
Lớp học mà chúng tôi quan sát là một lớp năm thứ hai của Đại học Y dược Tp
HCM. Tiết học này nghiên cứu mô hình ngưỡng P – K.
Từ băng ghi âm và những ghi chép khi quan sát, chúng tôi dựng lại biên bản
của tiết học (Phụ lục 2). Trong phần dưới, những trích dẫn in nghiêng được lấy từ
biên bản đã được phân thành 48 đoạn. Người ta dạy cho các bác sĩ tương lai những
gì về việc sử dụng mô hình ngưỡng trong tình huống điều trị ? Trong khuôn khổ có
hạn của luận án này chúng tôi chỉ trình bày vắn tắt dưới đây những điểm chủ yếu rút
ra từ phân tích tiết học đã quan sát. Phân tích được thực hiện theo mô hình tổ chức
didactic của Thuyết nhân học.
79
• Đoạn 1 – 8: GV bắt đầu bằng việc giới thiệu mô hình ngưỡng. Đây là thời
điểm gặp gỡ lần đầu tiên với kiểu nhiệm vụ TQĐ - ra quyết định lâm sàng.
Ta thấy là kiểu nhiệm vụ TQĐ đã được nghiên cứu trước TĐG, TXĐ, và TT. Mô
hình ngưỡng là yếu tố công nghệ của τQĐ. Khi quan sát giờ học, chúng tôi thấy là kỹ
thuật τQĐ được đưa vào tường minh ngay sau đó, không kèm theo ví dụ.
• Đoạn 9 – 14: Nghiên cứu kiểu nhiệm vụ TĐG – đánh giá XS tiền nghiệm.
Như chúng tôi đã nói, TĐG không phải là một kiểu nhiệm vụ toán học. Kỹ thuật τĐG
được xây dựng thông qua một ví dụ về chẩn đoán bệnh Wilson.
• Đoạn 15 - 18: trở lại với kiểu nhiệm vụ TQĐ.
Đoạn này ứng với thời điểm làm việc với kỹ thuật τQĐ thông qua ví dụ về chẩn
18. Trong bệnh suyễn, ta chọn ngưỡng XN là 10%, ngưỡng điều trị là 80%. Ta có (GV
viết lên bảng):
Sau khi khám lâm sàng bác sĩ sẽ đánh giá P(B+). Nếu P(B+) < 0,1 thì bác sĩ quyết định
chưa điều trị, cũng không làm XN mà chỉ để theo dõi thêm. Nếu P(B+) > 0,8 thì cần điều trị ngay. Nếu 0,1 < P(B+) < 0,8, bác sĩ hy vọng kết quả hô
hấp ký sẽ giúp chẩn đoán hay loại trừ được bệnh suyễn và cho bệnh nhân làm XN đó.
đoán bệnh suyễn.
Như vậy, SV làm việc trên mô hình ngưỡng vừa được đưa vào thông qua
tT và Tγ đã cho ( tT = 0,1 và Tγ = 0,8). Nhưng GV không đưa
một ví dụ, trong đó
ra một lời giải thích nào về cách thức tính toán để có các giá trị này. Thời điểm
làm việc với kỹ thuật τQĐ do GV thực hiện, không có sự tham gia của SV.
• Đoạn 19 – 25: Thời điểm nghiên cứu kiểu nhiệm vụ TXĐ.
Ví dụ trên làm nảy sinh nhu cầu nghiên cứu kiểu nhiệm vụ TXĐ. Nhu cầu này
19. (SV): Làm sao ta biết được
tT = 0,1 và Tγ = 0,8 ? Làm thế nào để xác định hai
ngưỡng này ?
được một SV đưa ra.
80
Hai kỹ thuật xác định các ngưỡng đã được GV giới thiệu. Kỹ thuật thứ nhất,
ký hiệu τXĐ, tương ứng với kỹ thuật đã được nói đến trong giáo trình V1: nó không
chứa đựng một yếu tố số nào và dựa vào những kiến thức nghề nghiệp. Nhưng sau
đó GV đã tách khỏi giáo trình bằng cách bình luận về phương pháp tìm ngưỡng vừa
25. (GV): Để khắc phục nhược điểm của phương pháp chỉ dựa chủ yếu vào kinh
nghiệm, một số tác giả đã đề nghị sử dụng hai công thức sau:
−
−
1
1
+
−
=
+
=
+
LR
LR .
.
;
T γ
T t
B R
B R
1
1
Trong đó R là tỷ lệ gây rủi ro (Risk), B là tỷ lệ lợi ích (Benefits)”.
dạy và bổ sung cho nó hai công thức (kỹ thuật τ'XĐ).
Các yếu tố lý thuyết không được trình bày. Kỹ thuật mới τ'XĐ được đưa vào
không được GV giải thích.
=
p P B+ (
)
• Đoạn 29: Nhắc lại kỹ thuật τQĐ đã được thể chế hóa ở đoạn 17. Tuy nhiên,
là XS tiên nghiệm. Việc nhắc lại được làm với mục vào thời điểm đó thì
đích đưa vào kiểu nhiệm vụ TT - xác định XS hậu nghiệm, xuất hiện như một kiểu
nhiệm vụ con TQĐ.
• Đoạn 30 - 34: GV trình bày kỹ thuật τT (sử dụng công thức Bayes).
Chúng tôi nhắc lại rằng đối với kiểu nhiệm vụ TT còn tồn tại hai kỹ thuật khác
– sử dụng bảng 2×2 và dùng tỷ cơ hội, đã được dạy trước khi nghiên cứu mô hình
ngưỡng. Nhưng GV không nói đến hai phương pháp này. Một cơ hội so sánh các kỹ
thuật và đánh giá chúng đã không được tận dụng. Hai kỹ thuật đã biết nhưng bị loại
đi không được giải thích tại sao.
• Đoạn 35 - 45: thời điểm làm việc với bốn kiểu nhiệm vụ và các kỹ thuật đã
dạy. Các kỹ thuật khác nhau được sử dụng thông qua một ví dụ về chẩn đoán bệnh
B cho một bệnh nhân.
• Đoạn 46 - 47: thể chế hóa lần nữa các kỹ thuật vừa đưa vào. Các yếu tố
công nghệ - lý thuyết không được nhắc lại.
Phân tích trình bày ở trên cho ta thấy là trong tiết học đã quan sát chỉ có một
praxéologie duy nhất được dạy - nó xoay quanh kiểu nhiệm vụ TQĐ.
81
Trong praxéologie này, TĐG, TXĐ và TT là ba kiểu nhiệm vụ con của TQĐ và do
đó chúng tham gia vào kỹ thuật đưa ra quyết định trong tình huống chẩn bệnh.
Chỉ có TXĐ, và TT là những kiểu nhiệm vụ mà để giải quyết sẽ tồn tại những
kỹ thuật toán học. Thay vì chỉ trình bày kỹ thuật dựa vào kinh nghiệm nghề nghiệp
của bác sĩ như giáo trình V1, GV đã đưa thêm kỹ thuật τ'XĐ. Đối với TT , chỉ một
trong ba kỹ thuật toán học có mặt trong V1 được GV dạy. Ta có thể nói praxéologie
liên quan đến TXĐ được dạy là một praxéologie hỗn hợp, phối hợp giữa tri thức toán
học với tri thức nghề nghiệp.
Về việc soạn thảo các yếu tố công nghệ và lý thuyết, ta thấy chúng chủ yếu
mang đặc trưng nghề nghiệp trong đó có căn cứ vào kinh nghiệm của bác sĩ đối với
bệnh này hay bệnh kia: những yếu tố công nghệ - lý thuyết mang bản chất toán học
của các praxéologie được dạy đã vắng mặt, dù có những kỹ thuật toán học được đưa
vào. Ta có thể đặt ra câu hỏi hệ về hệ quả của sự không đầy đủ của những
praxéologie được dạy đối với việc làm chủ vấn đề chẩn bệnh để điều trị cho bệnh
nhân – một nhiệm vụ chủ yếu của bác sĩ.
2.5. KẾT LUẬN CHƯƠNG 2
Mục đích của các nghiên cứu y học nhằm cải thiện phương pháp điều trị,
hoạch định các chính sách y tế, mang lại lợi ích cho sức khỏe cộng đồng, nâng cao
chất lượng điều trị và chăm sóc bệnh nhân. Hầu hết các nghiên cứu y học đều có sự
đóng góp của XS-TK trong phân tích DL, trong ước lượng khoảng tin cậy và trong
KĐ giả thuyết, trong quyết định lâm sàng.
Việc kết hợp giữa các phương pháp TK như ước lượng khoảng tin cậy, KĐ giả
thuyết TK và các phương pháp chẩn đoán y học dựa trên XS tiền nghiệm, XS hậu
nghiệm, mô hình ngưỡng, … là một trong những biện pháp nâng cao tính chính xác
của các chẩn đoán y học, góp phần tích cực trong công tác điều trị và chăm sóc
bệnh nhân.
Phân tích trong chương này cho thấy XS-TK đóng vai trò quan trọng trong
lĩnh vực phòng bệnh, chẩn đoán, điều trị, tư vấn cho bệnh nhân cũng như trong các
nghiên cứu y học. Thực tế đã chứng tỏ rằng, nếu chỉ dùng kinh nghiệm cá nhân rút
82
ra được sau một vài lần điều trị thử mà không có các phương pháp kiểm tra đánh giá
bằng các bằng chứng khoa học thì phương pháp điều trị đó thường có độ tin cậy
không cao, thậm chí nguy hiểm cho tính mạng của người bệnh.
Để đưa ra các quyết định đúng đắn, người thầy thuốc phải cân nhắc, tổng hợp
các thông tin từ nhiều nguồn khác nhau như: kết quả XN, chẩn đoán hình ảnh, thăm
dò chức năng từ các nghiên cứu, thử nghiệm lâm sàng, v.v…. Như chúng tôi đã
phân tích, việc sử dụng tổng hợp các thông tin này đòi hỏi một số kiến thức về XS-
TK. Tuy nhiên, nhiều cán bộ y tế, nhiều nhà nghiên cứu trong lĩnh vực y tế chưa
được đào tạo và cập nhật các kiến thức về XS - TK, về các phần mềm TK trong
phân tích và xử lý DL, … nên khó tránh khỏi những sai sót trong nghiên cứu, trong
việc hoặch định chính sách y tế, ảnh hưởng đến hiệu quả điều trị và chăm sóc sức
khỏe cho bệnh nhân. Hậu quả của những sai sót này thì thường không nhỏ: ảnh
hưởng đến sức khỏe cộng đồng, thậm chí nguy hiểm đến tính mạng của bệnh nhân
khi đưa ra các quyết định sai lầm.
Những sai sót này có gặp ở SV y khoa hay không ? Phương pháp nào giúp hạn
chế và khắc phục sai sót ? Hai câu hỏi đó sẽ được xem xét trên một đối tượng tri
thức XS-TK cụ thể khi chúng tôi phân tích quan hệ thể chế và quan hệ cá nhân SV
đối với tri thức này.
83
CHƯƠNG 3
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
VÀ PHÂN PHỐI CHUẨN: MỘT PHÂN TÍCH TRI THỨC LUẬN
Ba bài toán cơ bản của lý thuyết TK là chọn mẫu, ước lượng các tham số (với
độ chính xác chọn trước) và KĐ giả thuyết TK. Chúng tôi đã chỉ rõ trong chương 2
là ba bài toán này luôn có mặt trong mọi nghiên cứu của y học.
Nhằm làm rõ cơ sở tham chiếu cho phân tích tri thức cần dạy và tri thức được
dạy ở hai chương tiếp theo, chúng tôi cần phải thực hiện một nghiên cứu tri thức
luận về đặc trưng của đối tượng tri thức muốn nghiên cứu.
Phần thứ nhất của chương dành cho việc trình bày một phân tích tri thức luận
về đối tượng KĐ giả thuyết TK. Ở đây chúng tôi sẽ chỉ ra một cách ngắn gọn các bài
toán KĐ giả thuyết TK, các phương pháp KĐ giả thuyết TK và các loại giả
thuyết TK.
Trong phần này chúng tôi không bàn nhiều về lí thuyết KĐ giả thuyết TK.
Vấn đề là để giải quyết bài toán đó thì điều kiện PPC của DL có vai trò quan trọng.
Chính vì thế nên chương này còn đề cập đến phân tích tri thức luận về PPC. Thông
qua việc nghiên cứu quá trình hình thành và phát triển của luật PPC, giả thuyết được
áp dụng phổ biến khi thực hiện KĐ giả thuyết TK và làm nên nền tảng của phân
tích TK, chúng tôi cố gắng làm rõ những đặc trưng tri thức luận cơ bản của đối
tượng tri thức đang bàn đến.
3.1. PHÂN TÍCH TRI THỨC LUẬN VỀ KIỂM ĐỊNH GIẢ THUYẾT TK
Điểm qua về quan điểm triết học, từ thời Hy Lạp cổ đại đến thế kỷ 16, thực sự
không có khái niệm KĐ giả thuyết. Thế giới quan lúc đó được quy định theo các
lược đồ tổng thể, nhận thức thế giới theo con đường suy luận diễn dịch, đòi hỏi diễn
giải chứng cứ ăn khớp với lý thuyết. Sang thế kỷ 17, Bacon viết Novum Organum
đặt lại cơ sở tri thức về thế giới dựa trên tiến trình quy nạp, nhận thức phải đi từ
quan sát tỉ mỉ tích lũy bằng chứng, tổng hợp các đặc thù riêng rẽ đến kết luận tổng
quát. Tư tưởng khoa học khuyến khích tìm và chấp nhận các ví dụ phản biện có sức
84
mạnh thuyết phục chứ không chấp nhận giáo điều chỉ đi tìm ví dụ khẳng định cho
một lý thuyết nào đó.
Từ đây hình thành thế giới quan khoa học mang bản sắc Newton, theo đó vật
chất hiện hữu tuân theo định luật và có cấu trúc xác định trong không gian và thời
gian. Khám phá thế giới là tìm ra các định luật này dựa vào quan sát, thực nghiệm
và suy luận quy nạp. Ngày nay, thế giới được quan niệm là một hệ thống phức hợp
không phải có thể quan sát toàn bộ, nhưng có thể thăm dò cấu trúc và tính toán. Các
sự kiện diễn ra thế nào phụ thuộc vào vị trí người quan sát và phương pháp
quan sát.
Phương pháp quy nạp đặt cơ sở nhận thức trên việc thu thập chứng cứ và thực
hành thử nghiệm, sự kiện có thể kiểm chứng và thử nghiệm có thể lặp đi lặp lại,
không chấp nhận các định kiến về kết quả thử nghiệm. Về thực hành, quy trình quy
nạp gồm các bước:
- Quan sát thu thập DL, loại bỏ các thành tố không thích đáng.
- Thử nghiệm kiểm tra giả thuyết
- Điều chỉnh giả thuyết
- Lập lý thuyết trên cơ sở thực nghiệm, DL và giả thuyết.
Lý thuyết đã được chứng minh là đúng phản ánh định luật, định luật không
bao giờ tuyệt đối đúng vì không thể chứng minh nó đúng tuyệt đối, định luật được
tạm chấp nhận đến lúc được chứng minh là sai. Hiện tượng lý thuyết không tương
hợp với các DL chứng cứ mới cho thấy lý thuyết luôn có khả năng sai và có thể
kiểm nghiệm sai, đây là đặc tính phản nghiệm khoa học.
Như vậy khoa học không hoàn toàn khách quan cũng không chủ quan, mà là
những hệ thống phát biểu về quan hệ giữa các sự kiện như đã được quan sát. Phản
biện khoa học là rất cần thiết, để lựa chọn các lý thuyết phù hợp nhất. KĐ giả thuyết
vì thế là một công cụ phân tích và phản biện rất sắc bén và hữu hiệu.
Mọi hoạt động trong tự nhiên và xã hội khi xảy ra đều tác động lên và chịu tác
động ngược của các hệ thống và quá trình phức hợp đan xen nhau, mà sự phân tán
biến động đều tồn tại trong mỗi quá trình, mỗi hệ thống. Vì vậy hiểu và giảm thiểu
85
biến động là con đường dẫn đến thành công và công cụ TK ứng dụng ngày càng trở
nên cần thiết. KĐ giả thuyết TK là công cụ thiết yếu để đi đến hiểu biết đúng và là
công cụ tạo chọn lọc tự nhiên đối với các lý thuyết khoa học.
Bản chất tự nhiên của tư duy yêu cầu điểm dựa của suy luận phải vững chắc
trên các định luật nghiêm ngặt và các quyết định theo đó phải rõ ràng, dứt khoát.
Tuy nhiên các số liệu thường biến động và có sự phân tán, nên các thông tin rút ra
cũng vừa bất định vừa bất toàn. Do đó tính chất ngẫu nhiên luôn tồn tại không thể
nào tách bỏ khỏi kết quả, gây ra khó khăn cho cả lập luận lẫn nhận thức.
Theo từ điển Hán - Việt, giả có nghĩa là ví, phỏng, nếu; thuyết nghĩa là chủ
trương, ngôn luận. Giả thuyết TK là một giả thuyết khoa học về tham số, về luật
phân phối hoặc về tính chất của biến ngẫu nhiên mà người ta muốn nghiên cứu trên
một tổng thể xác định thông qua việc quan sát, phân tích DL thu được từ mẫu. Bản
chất của KĐ giả thuyết TK là so sánh những gì quan sát được trong thực nghiệm
với những gì xảy ra nếu giả thuyết đặt ra là đúng. Mặc dù vẫn còn một số giới hạn
của các mô hình KĐ giả thuyết và có tranh cãi về những mô hình này, các nhà TK
học vẫn phải thừa nhận rằng KĐ giả thuyết TK đã ăn sâu vào trong khoa học.
3.1.1. Kiểm định giả thuyết thống kê trong lịch sử
KĐ giả thuyết được biết đến sớm nhất là thử nghiệm Pyx, một hình thức được
tổ chức định kỳ của Hoàng Gia Anh, thiết lập vào năm 1279. Thử nghiệm Pyx là
một KĐ về chất lượng của đồng tiền xu được phát hành. Trong mỗi lần chế tạo tiền
xu, một số lượng nhỏ đồng xu sẽ được lưu trữ trong các hộp gỗ. Hội đồng KĐ sẽ so
sánh giữa đồng xu được lưu trữ với đồng xu chuẩn để đánh giá về chất lượng và
thành phần của chúng. Trong mỗi lần thử nghiệm này thì giả thuyết đặt ra là:
H0: Đồng xu đúng chuẩn quy định, H1: Đồng xu không đúng chuẩn quy định
Từ năm 1700, các nhà thiên văn học thường xuyên sử dụng KĐ giả thuyết để
kiểm tra xem có hay không sự chênh lệch về số đo các thiên thể với mục đích muốn
biết chính xác vị trí của mặt trăng cho các mục đích hàng hải. Để làm được điều
này, các nhà thiên văn học sẽ so sánh giá trị khác biệt theo luật sai số, phân phối của
86
sai số (tuân theo PPC) về vị trí thực của mặt trăng theo âm lịch và giả thuyết đặt
ra là:
H0: Số đo trong mức giới hạn sai số cho phép; H1: Số đo ngoài mức giới hạn sai số
cho phép
Cũng như thử nghiệm Pyx, mỗi phép KĐ giả thuyết về thiên văn có một kết
cục nhị phân: sai số hoặc trong hoặc ngoài độ lệch cho phép. Các thử nghiệm này
nghiêng về thiết kế thử nghiệm hơn và mang tính chất hiệu chỉnh sai số.
Năm 1710, John Arbuthnot quan sát thấy tỷ lệ sinh con trai có lớn hơn tỷ lệ
sinh con gái chút ít, ông đặt giả thuyết về khả năng sinh trai gái như nhau và tính
toán trên số liệu thực nghiệm cho thấy giả định này rất không chắc chắn, XS là
20
1 4836 10×
. Ông lập luận rằng đây là chứng minh cho ý Chúa, con trai phải có mức
rủi ro chết non cao hơn con gái. Đây có thể coi là một KĐ giả thuyết TK với đầy đủ
ý nghĩa và quy trình.
Từ năm 1800 đến đầu những năm 1900, khái niệm tỷ chọi (odds) ra đời. Tỷ
chọi diễn tả tỷ số giữa khả năng xảy ra và không xảy ra của một biến cố và nếu tỷ
chọi càng lớn thì khả năng xảy ra của biến cố lớn hơn khả năng không xảy ra của
biến cố đó (Xem bảng 3.1). Theo đó, tỷ chọi chống lại việc bác bỏ giả thuyết không
− 1 α α
là .
Hình 3.1. Phân phối chuẩn
Tỷ số giữa 1 - α và α là tỷ chọi chống lại việc bác bỏ giả thuyết không.
87
Bảng 3.1. Các mức ý nghĩa giữa năm 1837 và 1908
[Nguồn: Douglas Curran-Everentt, 2009]
Năm 1900, Karl Pearson đề xuất KĐ chi bình phương nhằm so sánh phân phối
của tần số quan sát được và phân phối giả định theo lý thuyết.
Trong tác phẩm “The Probable Error of a Mean” (Sai số có thể của một trung
bình), William S. Gosset đã đưa ra một thủ tục mà sau này trở thành phép kiểm t
Đầu tiên, chúng ta tìm xác suất mà thuốc A làm tăng thời gian ngủ trung bình (tìm tỷ
số giữa trung bình mẫu và độ lệch chuẩn của mẫu) trong bảng mức ý nghĩa với 10
thực nghiệm bằng cách nội suy. Tỷ chọi là tỷ số giữa 0,887 và 0,113 tức là khoảng
8:1, tương ứng với đường cong chuẩn khoảng 1,8 lần sai số có thể. Từ đó có thể suy ra
rằng thuốc A làm tăng thời gian ngủ nhưng sẽ không ngạc nhiên nếu kết quả có thể bị
đảo ngược bởi các thực nghiệm khác. (Douglas Curran-Everentt, 2009)
một mẫu.
Theo thuật ngữ hiện tại thì thuật ngữ 1,8 lần sai số có thể có nghĩa là t = 1,8
trong phép kiểm t.
Năm 1919, lấy cảm hứng từ tác phẩm “The Probable Error of a Mean” của
Gosset, Fisher đã đề nghị rằng các nhà khoa học thực nghiệm cần thiết phải có một
người hướng dẫn thực hành về các phương pháp TK và ông đã viết cuốn “Statistical
Methods for Reseach Workers”. Trong tác phẩm này, Fisher đã 3 lần trích dẫn tiêu
chuẩn 5%. Ông cũng là người đầu tiên nhận ra tính chất tùy hứng của giá trị
Trong các ứng dụng chúng ta thường không muốn biết tần số tại bất kỳ khoảng cách
nào từ trung tâm khi tần số tổng cộng vượt quá khoảng cách đó; điều này được thể
hiện bằng diện tích đường cong điểm cắt tại bất kỳ điểm nào. Một độ lệch vượt quá độ
lệch chuẩn xảy ra khoảng một lần trong 3 thử nghiệm, 2 lần trong 22 thử nghiệm, 3
ngưỡng này.
88
lần trong 370 thử nghiệm. Giá trị p = 0,05, hoặc 1 trong 20, là 1,96 hoặc gần 2. Đây là
điểm thuận lợi để đánh giá xem độ lệch có thể được xem là có ý nghĩa hay không. Vì
vậy, độ lệch vượt quá hai lần độ lệch chuẩn được chính thức coi là có ý nghĩa.
(Douglas Curran-Everentt, 2009)
Năm 1925, ông trình bày toàn vẹn quan điểm mới, theo đó các số liệu được
xét như kết quả quả một biến ngẫu nhiên, biến ngẫu nhiên này được giả sử có một
phân phối XS. Mô hình của Fisher được ông gọi là “Test of Significance” (KĐ
mức ý nghĩa). Theo Fisher thì TK sử dụng phương pháp suy luận theo quy nạp toán
học, tức là phương pháp suy luận dựa vào quan sát các mẫu nhỏ rồi khái quát cho
dân số. Phương pháp này được thực hiện theo 3 bước như sau:
Bước 1: Đặt một giả thuyết H0 (giả thuyết không) là giả thuyết ngược lại với
những gì mà nhà nghiên cứu tin là sự thật.
Bước 2: Thu thập DL D liên quan đến H0
Bước 3: Ước tính XS DL D xảy ra nếu H0 là đúng, tức là tính p = P(D/ H0).
Theo Fisher giá trị p chỉ ra mức độ sai lệch của DL so với giả thuyết H0, p
càng nhỏ thì mức sai lệch càng lớn. Fisher đề nghị một tiêu chuẩn chủ quan nếu p từ
0,1 đến 0,9 thì không nghi ngờ gì về giả thuyết, nếu p dưới 0,02 thì rõ ràng giả
thuyết không tương hợp với tất cả DL, nếu p < 0,05 thì có thể kết luận không sai
lầm rằng DL không phù hợp với giả thuyết H0. Fisher không đưa ra giả thuyết chính
H1 (giả thuyết mong muốn của nhà nghiên cứu, giả thuyết thay thế khi H0 bị bác
bỏ) vì theo quan điểm của Fisher thì chỉ có thể kết luận bằng chứng dựa vào DL có
phù hợp với giả thuyết hay không chứ không thể bác bỏ hay chứng minh giả thuyết.
Năm 1928, Jerzy Neyman và Egon Pearson phê phán quan điểm của Fisher
nhất là sự tùy hứng trong chọn lựa KĐ TK. Theo hai ông, sức mạnh KĐ của bằng
chứng cần tách riêng khỏi nguy cơ sai lầm khi quyết định về giả thuyết. Tiêu chuẩn
tùy hứng khi chọn giá trị ngưỡng 0,05 là hoàn toàn chủ quan và vấn đề quyết định
phải được xây dựng theo quy trình hợp lý có luật bác bỏ/chấp nhận và có đánh giá
khả năng sai lầm. Neyman và Pearson cho rằng phương pháp của Fisher là vô
nghĩa, hai ông khẳng định việc chọn lựa KĐ TK nào và tiêu chuẩn KĐ nào phải
dựa vào cả giả thuyết H0 lẫn một giả thuyết thay thế H1 (hay HA). Từ đó, hai ông
89
thiết kế phương pháp “Test of Hypothesis” (KĐ giả thuyết). Mô hình của Neyman
và Pearson được thực hiện như sau:
Bước 1: Đặt giả thuyết không H0 và giả thuyết chính H1
Bước 2: Quyết định mức ý nghĩa α (XS bác bỏ H0 khi H0 đúng) và β (XS
không bác bỏ H0 khi H0 sai).
Bước 3: Thu thập DL liên quan đến giả thuyết và KĐ phân phối của DL.
Bước 4: Nếu DL nằm trong miền bác bỏ giả thuyết H0 thì bác bỏ H0, chấp
nhận H1 và ngược lại.
Như vậy phương pháp này chuyển bài toán KĐ về bài toán quyết định, thực
chất gồm 2 quyết định khác nhau là bác bỏ H0 hay không bác bỏ H0. Hai loại sai
lầm liên quan đến quyết định là bác bỏ H0 đúng và không bác bỏ H0 sai. Lực của
KĐ đo bằng XS bác bỏ H0 khi H0 đúng.
Mô hình của Neyman và Pearson sau đó đã bị Fisher bác bỏ hoàn toàn. Theo
Fisher, không thể có tiêu chuẩn bất biến nào cho mức ý nghĩa, cũng không thể chấp
nhận cách tiếp cận theo bài toán quyết định vì nó làm mất ý nghĩa của KĐ giả
thuyết. Vì thế ông cho rằng cách tiếp cận này tuy phù hợp với những mô hình phức
tạp cũng như cho thấy đánh giá tối ưu cho miền giá trị chấp nhận được, nhưng
phương pháp không đúng thì kết quả không đáng tin cậy.
Sự tranh cãi gay gắt về các quan điểm đối lập giữa các tác giả và những người
ủng hộ đã kéo dài nhiều thập kỷ sau đó. Trên các tạp chí y học, xu hướng trình bày
kết quả định lượng thường không thống nhất, dùng khoảng tin cậy hay dùng giá trị
p. Kết quả được phân loại thành có ý nghĩa TK và không có ý nghĩa TK, tùy theo p
dưới ngưỡng hay quá ngưỡng 0,05. Tuy nhiên có ý nghĩa TK và có ý nghĩa lâm
sàng không đồng nghĩa với nhau, có khi không ăn nhập gì nhau. Thêm nữa, không
có ước lượng giá trị tham số, cũng không có đánh giá sai lầm loại II gây nên tình
trạng bất cập, khi những kết quả có ý nghĩa lâm sàng bị bỏ qua chỉ vì cỡ mẫu nhỏ và
bị coi là không có ý nghĩa TK. Ngoài ra, khoảng tin cậy 95% ngầm nói đến ngưỡng
0,05, vì vậy rất nhiều hiểu lầm trong thực hành và giảng dạy kéo dài nhiều năm
bỗng trở thành tiêu chuẩn chân lý được chấp nhận không bàn cãi.
90
Năm 1950, lý thuyết quyết định của Wald và tiếp cận XS chủ quan Bayesian
do Savage và de Finetti được công bố, chiều hướng tranh luận trở nên không tập
trung mà phức tạp hơn với nhiều quan điểm trái chiều đan xen phức tạp. Năm 1989,
một lý thuyết lai giữa hai mô hình KĐ chính thức được đề xuất. (Gigerenzer,
Swijtnik, Porter, Beatty, Kruger, Daston, 1989).
3.1.2. Mô hình kiểm định giả thuyết thống kê được sử dụng trong y học hiện nay
Ngày nay các nghiên cứu khoa học được thực hiện bằng phương pháp KĐ giả
thuyết TK đã sử dụng kết hợp giữa mô hình KĐ ý nghĩa của Fisher và mô hình KĐ
giả thuyết của Neyman và Pearson. Trong các nghiên cứu y học, người ta thường sử
dụng mô hình thử nghiệm lâm sàng đối chứng ngẫu nhiên, về bản chất là sự dung
hòa về mặt phương pháp của hai trường phái trên. Đây là mô hình được xếp vào
hạng có ý nghĩa nhất trong các mô hình nghiên cứu y học.
(Nguyễn Văn Tuấn, 2011c)
Mô hình này được tiến hành như sau:
Bước 1: Đặt giả thuyết không H0 và giả thuyết chính H1.
Bước 2: Tính cỡ mẫu theo mức ý nghĩa α và β mong muốn. Mức ý nghĩa này
cũng cho phép tìm được giá trị ngưỡng. Giá trị đó là cơ sở để đưa ra miền chấp
nhận (và miền bác bỏ) giả thuyết H0.
Bước 3: Thu thập DL D liên quan đến giả thuyết.
Bước 4: Tính giá trị TK: tính u khi kích thước mẫu đủ lớn (phân phối đã được
0).
xem là chuẩn theo định lý giới hạn trung tâm), tính t khi DL có phân phối Student hoặc F khi so sánh hai phương sai (phân phối Fisher),… và tính XS p = P(D/H
Bước 5: Kết luận: Chấp nhận H0 khi p > 0,05 hoặc bác bỏ H0 khi p < 0,05.
Ở bước 4, các tính toán trong mọi trường hợp đều đòi hỏi tính chuẩn của DL.
Nếu điều kiện PPC không thỏa mãn thì kết luận có thể không chính xác. Chính vì
thế, trước khi thực hiện bước 4 người ta phải kiểm tra tính chuẩn của DL. Nhưng
điều đó không được nói rõ trong mô hình năm bước trên.
Hiện nay giảng dạy KĐ giả thuyết TK gặp nhiều khó khăn, nguyên nhân xuất
phát từ sự xung đột giữa hai quan điểm KĐ giả thuyết khoa học theo Fisher hay
91
Neyman-Pearson. Trong các giáo trình TK y học vẫn trình bày theo tiếp cận bài
toán quyết định và sự phân loại có ý nghĩa/không có ý nghĩa, trong khi đó các tạp
chí chuyên môn y học không còn trình bày theo tiếp cận Neyman-Pearson nữa. Kỹ
năng trình bày kết quả định lượng theo khoảng tin cậy và giá trị p đang phổ biến,
cốt lõi lý luận của những kỹ năng này nằm ở những kiến thức về PPC. Vì vậy chúng
tôi tiến hành phân tích các đặc trưng tri thức luận của PPC trong bài toán KĐ giả
thuyết TK.
3.2. PHÂN TÍCH TRI THỨC LUẬN VỀ PHÂN PHỐI CHUẨN
Luật PPC là một phần quan trọng của lí thuyết XS và ứng dụng TK. Có thể
nói, nếu không có PPC thì không có phép KĐ TK, cũng không có cả phân tích TK.
Vai trò của luật PPC đã được chứng minh và khẳng định giá trị qua nhiều thế hệ
nghiên cứu học thuật, lịch sử phát triển của khái niệm PPC gắn liền với rất nhiều
thành tựu quan trọng trong nhiều lĩnh vực toán học, đặc biệt là giai đoạn toán học
hiện đại.
PPC không chỉ là một công cụ toán học hay chỉ có giá trị biểu tượng, mà là
một quy luật vận hành của giới tự nhiên và xã hội đã được nhận thức và kiểm
chứng. Theo đó, nguyên nhân tính phổ biến rộng rãi của PPC đã được giải thích.
Theo Borel, PPC là quy luật của hiện tượng ngẫu nhiên, trong đó nhiều nguyên
nhân tác động mà không nguyên nhân nào là quyết định. Theo Liapunov (1954), đại
lượng ngẫu nhiên là tổng một số lớn các đại lượng ngẫu nhiên độc lập và phương
sai rất bé so với phương sai của tổng. Trong thực tiễn, mỗi đại lượng ngẫu nhiên
được sinh ra bởi vô số nguyên nhân, trong đó không nguyên nhân nào chiếm ưu thế
so với các nguyên nhân còn lại, nên phương sai của mỗi nguyên nhân là rất nhỏ
không so sánh được với phương sai của đại lượng được xét. Do đó phần lớn các đại
lượng ngẫu nhiên trong thực hành có PPC.
Trong phần dưới, chúng tôi trình bày những kết quả rút ra từ quá trình hình
thành và phát triển của luật PPC, trên cơ sở đó làm rõ những đặc trưng tri thức luận
cơ bản. Những đặc trưng này sẽ phải tính đến trong DH KĐ giả thuyết TK – đối
tượng nghiên cứu của hai chương tiếp theo.
92
Ở đây chúng tôi tìm câu trả lời cho những câu hỏi sau về PPC:
- Điều kiện nảy sinh và những đặc trưng cơ bản của khái niệm PPC là gì?
- Khái niệm PPC được hình thành và phát triển qua các giai đoạn nào?
- Bài toán và các đối tượng liên quan gắn với khái niệm PPC là gì?
- Có những cách tiếp cận nào liên quan đến khái niệm PPC? Sự tương đồng và khác
biệt giữa những cách tiếp cận này là gì?
Về giới hạn nghiên cứu, chúng tôi tập trung phân tích các khái niệm dùng
trong phương pháp Thống kê xác suất (probability-based statistical method) và
Thống kê có tham số (parametric statistics) trong khoảng thời gian lịch sử từ năm
1730 đến năm 1920. Đây cũng là những kiến thức cơ bản, mở đầu của học phần
XS-TK được giảng dạy tại ĐHYD Tp HCM.
3.2.1. Lịch sử hình thành khái niệm PPC
Ban đầu PPC xuất hiện chỉ như một công cụ giải tích trợ giúp cho tính toán
XS. Sau một quá trình tích lũy phát triển lâu dài qua nhiều thế hệ các nhà nghiên
cứu PPC mới được công nhận là khái niệm trọng tâm của XS-TK. Luật PPC được
ứng dụng cho nhiều hiện tượng tự nhiên với các đơn vị đo khác nhau và tham số
khác nhau, điều này gây khó khăn khi so sánh biến số. Vì vậy, cần xây dựng luật
phân phối chuẩn tắc độc lập với đơn vị đo. Do PPC được xác định bởi 2 tham số
trung bình và độ lệch chuẩn, nên phân phối chuẩn tắc có trung bình là 0 và độ lệch
chuẩn là 1. Phép biến đổi chuẩn hóa biến ngẫu nhiên chính là hoán chuyển z, cho
2
−
z
0,5
=
φ
e
z ( )
kết quả là chỉ số z. Một biến ngẫu nhiên Z được gọi là có phân phối chuẩn tắc khi
1 π 2
nó có hàm mật độ XS. . Hàm này hiển nhiên dương, nhưng không
∞
2
−
z
0,5
=
e
dz
dễ dàng thấy được đó là hàm mật độ XS, vì muốn vậy cần tính được tích
∫
π 2 2
0
. phân
Cuốn sách đầu tiên về lí thuyết XS, The Doctrine of Chances: or a method of
calculating the probability of events in play được viết bởi Abraham de Moivre và
được xuất bản 3 lần vào những năm 1718, 1738 và 1756. Trong đó, khái niệm mật
93
nghiên cứu sâu các hệ số của hạng tử và chỉ ra khi n lớn, hệ số của hạng tử
độ XS chưa được đề cập mà chỉ xoay quanh vấn đề luật của khai triển nhị thức (a+b)n
2 nπ
x
2
m
m
m
m x
( )b x
2
( ) b x
trung tâm xấp xỉ . De Moivre chứng minh rằng khi n=2m, với
2 x
2 x
0, 7976 n
1 2
1 2 ( ) 2
2 2 / l
n
2 ( 2 / ) n l
( b m l
( ) b m e
)
, thì . Ông cũng chứng minh rằng
2 e np
. Tuy nhiên ông chỉ dừng lại ở các tính toán này
mà không đi xa hơn, về mặt tính toán cũng như phát triển khái niệm TK, ông không
2s để trình bày công thức giống với dạng hiện đại, cũng
xf ( )
1
dùng khái niệm về độ lệch
không đánh giá giới hạn chuỗi tổng của dãy b(m+l) để chứng minh .
2 p
cũng do Stirling tính toán. Ngay cả giá trị chính xác của hằng số
Như vậy đây là dẫn nhập đầu tiên về PPC như là một giới hạn của dãy phân
phối nhị thức.
Trong cuốn sách, vai trò của định lí giới hạn trung tâm được quan tâm, với
định hướng ứng dụng trong khoa học bảo hiểm, các định nghĩa và kết quả được
trình bày với nhiều tính trực giác và thực nghiệm: “Phân phối xác suất của một số
lần đạt mặt ngửa khi tung một đồng xu 1800 lần”. Nghiên cứu của Moivre chỉ giới
hạn trong các yếu tố cơ bản nhất của lí thuyết XS, chứ chưa đề cập đến các vấn đề
phương pháp của TK, ngay cả các ứng dụng cũng chỉ trong vấn đề về tính may rủi
và thăng giáng của các hiện tượng. Đáng chú ý là đóng góp của ông nhằm xây dựng
công cụ tính toán gần đúng khi tham số lớn, ông chỉ nhằm xây dựng phép xấp xỉ
chuẩn tắc cho nhị thức Newton, đường cong chuẩn tắc chỉ đóng vai trò công cụ tính
toán nhằm trình bày một xấp xỉ liên tục cho một đối tượng toán học rời rạc, chứ
không phải là đường cong liên tục mật độ XS. Đây là phương pháp hàm sinh
(generating function), được sử dụng xuyên suốt tác phẩm. Ông cũng chỉ ra sự quan
trọng của cỡ mẫu n, chỉ ra độ lệch từ trung tâm phụ thuộc vào n. Ông cũng chỉ ra
bản chất của luật PPC, khi XS của biến cố là 0.5, PPC là luật phân phối giới hạn của
94
số lần xảy ra biến cố khi số các phép thử tăng lên vô hạn. Tuy nhiên, ông không đi
xa hơn, để tiến đến luật số lớn và định lí giới hạn trung tâm. Những thành quả này
cần nhiều năm sau do một nhà cơ học triết học và toán học người Pháp khác khám
phá. Thời kì của Moivre gắn liền với lí thuyết XS cổ điển, TK học chưa có sự phát
triển về phương pháp riêng và nền tảng toán học mà chủ yếu tập trung vào mô tả.
TK suy luận phải đợi một thời gian sau, với các công trình của Laplace và Gauss.
Hai hướng nghiên cứu phát triển tuy khác nhau nhưng cùng tạo nên nền tảng của
TK suy luận, hai nhà toán học này cũng là những nhà triết học, cơ học và thiên văn
học xuất sắc.
Các nghiên cứu liên quan đến PPC được định hình từ hai nguồn, nguồn thứ
nhất tiếp nối các công trình của Moivre đưa ra các tính toán chuẩn hóa tham số và
suy luận về tham số của nhị thức Newton, nguồn thứ hai xuất phát từ bài toán
ngược trong cơ học nhằm suy đoán ước lượng hệ số của mô hình tuyến tính, gọi là
phương pháp bình phương tối thiểu.
Vào năm 1774, Laplace đưa ra tính toán chặt chẽ đầu tiên đánh giá tích phân
trên, trong bài viết Mémoire sur la probabilité des causes par les événements. Các
(
p
1)
3 )
(
p
E
dz 2 .exp(
zz
)
tính toán tích phân phức tạp được trích dẫn,
q p 1)...( q 1.2.3...
(
p
p q p q q
p q )
q 2 pq
p
3 )
(
3 )
q
zz
dz 2 .exp(
)
ln
zz
m
.
2
p
d
m
q pq 2
pq 2 q )
(
m ln
( p 2 pq
m lấy giá trị từ 0 đến 1 và giả sử tích phân bắt đầu từ 1, ta cần giá trị của nó tại 0.
Đặt , ta có . Số
n i
n m m d
m
d
Giả sử tích phân đi từ 0 đến 1, ta có
2
i
m 2
i
ln
ln
m d
p 2 i
2 i
m
2 i
m
m d
(1
m
)
1
m
p
2
3 )
(
p
p
dz 2 .exp(
zz
)
,
dm ln
m
q 2 pq
pq 3 2
q
p
)
(
21 x 2
e
dx
suy ra . Do đó, dẫn đến E=1.
p 2
0
Từ kết quả trên, với p=q=1/2 và x=2z, ta có .
95
Năm 1782, Laplace với những đóng góp to lớn về lí luận và tính toán đã đưa
ra khái niệm hàm mật độ XS và chuẩn hóa các tham số của PPC. Công lao của
Laplace là nêu lên vai trò trung tâm của luật PPC, đóng góp nhiều xây dựng về lí
thuyết cho khái niệm PPC. Ông đã chỉ ra cách lập luận dựa vào XS để suy luận về
tham số p, không những thế, ông đã mở rộng phương pháp suy luận tổng quát hóa
kết quả cho rất nhiều các phân phối XS.
Năm 1812, Laplace hoàn tất công trình Théorie analytique des probabilités,
trong đó trình bày các kết quả căn bản với hình thức toán học chặt chẽ và toàn bộ lí
thuyết sai số. Đó là một nền tảng vững để khẳng định vai trò của PPC. Nền tảng lí
thuyết của PPC được khẳng định qua định lí giới hạn trung tâm, do Laplace phát
biểu và chứng minh. Qua đó, PPC được dùng để xấp xỉ và ước lượng các phân phối
của tổng và trung bình của bất kì biến ngẫu nhiên của bất kì phân phối nào.
Vào năm 1819, ông đã phát triển định luật Laplace, sau này gọi là định lí giới
hạn trung tâm, nhấn mạnh vai trò quan trọng về mặt lí luận của PPC. Theo định lí
này, phân phối của tổng các biến ngẫu nhiên xấp xỉ về PPC khi số biến ngẫu nhiên
lớn. Định lý chỉ ra tính khách quan của PPC như một luật tự nhiên, phù hợp với
quan sát thực nghiệm và được chứng minh toán học. Ông cũng trình bày cách tính
tích phân Laplace, tìm ra hằng số chuẩn hóa của PPC, đưa một lớp các PPC đa dạng
về một phân phối chuẩn tắc thuận tiện cho tính toán thực nghiệm. Tuy nhiên, ông
không nói về PPC như một luật khách quan mà chỉ là một giới hạn của các hiện
tượng, theo đó, một biến ngẫu nhiên gồm nhiều tác động, mỗi tác động độc lập,
đóng góp như nhau thì sẽ xấp xỉ PPC. Thời kỳ của Laplace, các phương pháp của
TK học được phát triển mạnh dựa vào nền tảng lý thuyết XS gắn với các công trình
vật lý. Laplace cũng là một nhà cơ học vĩ đại, tư tưởng tất định luận gắn liền thời kỳ
này với tên tuổi của ông. Laplace tin rằng vũ trụ vốn theo quy luật tiến hóa có trật tự
nghiêm ngặt nhưng cũng rất phức tạp bao gồm sự vật hiện tượng tương tác chồng
chéo nhau mà sinh ra sự mập mờ thăng giáng vô trật tự, ông cũng lý giải cách thức
vũ trụ tiến hóa tạo ra thế giới mà không chấp nhận Thượng Đế. Khi hoàng đế
Napoleon hỏi ông đặt Thượng Đế ở đâu trong hệ thống, ông đã trả lời: Thưa hoàng
96
đế, tôi không cần giả thuyết ấy. Cách tư duy này gắn liền với các thành quả khoa
học kỹ thuật rực rỡ thời đó, trong đó phương pháp thực nghiệm đạt thành công kỳ
diệu.
Thời kỳ này cơ học nói chung và cơ học thiên thể rất phát triển, bài toán trung
tâm là tổng hợp thông tin từ những số liệu quan sát và thực nghiệm, các nhà khoa
học đã thành lập được các mô hình tuyến tính, nhưng rất lúng túng trong việc xử lý.
Ngay cả nhà toán học vĩ đại Euler, người được mệnh danh là hiện thân của giải tích
cũng từng đầu hàng trước bài toán này. Sự phức tạp nằm ở chỗ, các quan sát sẽ càng
chính xác khi số lần quan sát tăng lên, cũng đưa đến việc số phương trình tuyến tính
liên kết với các quan sát cũng tăng lên, mặt khác các mô hình tuyến tính tuy dễ
thành lập và tiện hiệu chỉnh sai số nhưng lại gây khó khăn khi có kích cỡ lớn. Các
bài toán này liên quan chủ yếu đến xác định vị trí, quỹ đạo của các hành tinh trong
hệ Mặt trời và thiên thể khác. Thành quả thời kỳ Phục Hưng của định luật Kepler
không dựa trên phân tích TK cũng không dựa trên mô hình tuyến tính, mà dựa vào
số liệu quan trắc mà Kepler đề xuất mô hình. Ông không hề KĐ tính tin cậy hay sự
trùng khít của mô hình quỹ đạo thiên thể theo logic TK, mà chỉ xác nhận mô hình lý
thuyết giải thích tốt số liệu quan trắc.
2
x
f x ( )
e−=
Laplace đã mở rộng kết quả của Moivre cho trường hợp phi đối xứng, khi XS
của biến cố không là 0.5. Hàm Gauss đã được soi rọi vai trò, ý nghĩa
trong bước tiến gắn với tên tuổi của Laplace. Thời kì Laplace nở rộ các phương
pháp tính toán giải tích và khai sinh các hàm quan trọng trong XS-TK, như hàm
2
x
,
x
2
Γ
=
f x er ( )
− t e dt
= − 1
∫
2 π
1 2 π
−∞
sai số:
= Φ − Φ −
= Φ −
f er
n ( )
(
n
)
n 2 ( ) 1
n 2
với ứng dụng lớn:
97
+∞
2
= −
=
fc x
− t e dt
er
f x ( ) 1 er ( )
∫
2 π
x
x
ω
x ( )
−= e
er
fc
− ( ix)
2
+∞
=
= − Φ =
1
( ) Q x
− 1 er f
( ) x
t − 2 e dt
∫
1 2
x 2
1 π 2
x
Các định lí giới hạn chỉ nêu lên mặt định lượng của luật số lớn, theo đó trung
bình kết quả quan sát một số lớn các thử nghiệm độc lập trên cùng một đại lượng
ngẫu nhiên có xu hướng hội tụ về giá trị kì vọng và mất dần tính ngẫu nhiên. Các
định lí này quá đặc biệt nên không giải thích được nguyên nhân tính phổ biến của
PPC, cũng không chỉ ra được điều kiện nào là cơ sở để xây dựng PPC. Những hạn
chế này phải đợi hơn một thế kỉ sau mới được Liapunov (1954) giải quyết và
Bernshtein (1946) mở rộng cho vector ngẫu nhiên.
Như vậy, Moivre là người đầu tiên đề cập đến PPC, tuy nhiên ông không hề
quan tâm đến việc nghiên cứu sâu hơn mà chỉ dừng lại ở chỗ đề ra một luật xấp xỉ
cho hệ số của khai triển nhị thức Newton. Mặc dù ý định của ông là xây dựng một
học thuyết về tính ngẫu nhiên và sử dụng đại số tổ hợp kết hợp giải tích, nhưng ông
không đi xa hơn trong việc xem xét luật xấp xỉ ấy là một luật về tính ngẫu nhiên.
Điều này có thể do ông ý thức được về tính bất định là rất phổ biến, trong khi học
thuyết của ông chỉ quan tâm giải quyết một lớp rất nhỏ các vấn đề ngẫu nhiên đo
đạc được, cũng có thể do quan điểm thực chứng khiến ông không quan tâm đến việc
đề ra những khái niệm mới mà chỉ coi là những công cụ phục vụ cho một học
thuyết, xây dựng xong học thuyết thì các công cụ tạm bợ cũng sẽ chấm dứt vai trò
lịch sử.
Năm 1809, Gauss công bố độc lập các kết quả tính toán trong tác phẩm lí
thuyết về chuyển động của các thiên thể theo quỹ đạo conic. Trong đó, nhiều kết
quả quan trọng như: phương pháp bình phương tối thiểu, phương pháp hợp lí cực
đại và PPC. Gauss không phát minh ra phương pháp bình phương tối thiểu, nhưng
đã chỉ ra phương pháp tương đương với phương pháp bình phương tối thiểu. Ông
chỉ ra rằng, sử dụng phân phối các sai số của hệ số tuyến tính theo đường cong hình
98
chuông úp và cực đại hóa tính hợp lí thông qua cực đại hóa phân phối hậu nghiệm
của sai số là cách làm tương đương với sử dụng phương pháp bình phương tối thiểu.
Kết quả này phù hợp với nhận định của Laplace vào năm 1810 cho rằng hiệu chỉnh
các sai số đột biến có thể dựa vào định lí giới hạn trung tâm. Hai ông đã tiến đến rất
− ∆∆ hh
ϕ
∆ =
e
gần phương pháp hồi quy tuyến tính, và đã xây dựng nền tảng lí luận toán học chặt
h π
chẽ cho PPC. Theo kí hiệu của Gauss , trong đó ∆ là độ lớn của sai
số, h là độ chính xác của quan sát, ϕ∆ là luật XS của sai số phép đo với độ lớn ∆.
Ông đặt giả thuyết rằng giá trị kì vọng là trung bình số học của các giá trị đo được,
rồi chứng minh luật PPC của sai số là luật phân phối duy nhất hợp lí cho sự chọn
lựa giá trị trung bình như là một đánh giá xấp xỉ cho tham số vị trí. Sử dụng luật
phân phối này như một hình mẫu phổ biến cho sai số thực nghiệm, ông đã xây dựng
phương pháp bình phương tối thiểu phi tuyến gia trọng. Gauss thể hiện phẩm chất
của nhà nghiên cứu khách quan, phát triển hài hòa cả hai phương diện thực nghiệm
đo đạc và nghiên cứu lý thuyết. Ông phát triển PPC nhằm làm rõ cho phương pháp
bình phương tối thiểu, phương pháp này là cơ sở tính toán khoa học nhằm giải
quyết một lớp rất lớn các bài toán ứng dụng. Tuy nhiên, ông cũng để ý đến tính chất
của PPC và đặt giả thuyết về một luật khách quan mà không chứng minh luật này đề
cập đến phân bố tự nhiên của các sai số không hệ thống, ngẫu nhiên và không thể
2
=
=
2 = µ σ 0,
,
f x ( )
− xe π
1 2
loại trừ trong công tác đo đạc. Gauss cũng đưa ra khái niệm PPC với
Độc lập với Gauss, nhà toán học và kỹ sư người Anh Robert Adrain (1775 -
1843) phát minh ra phương pháp bình phương tối thiểu và áp dụng trong các bài
toán hiệu chỉnh đo lường và thủy động học. Năm 1808, Adrain dùng phương pháp
bình phương tối thiểu để chỉnh lí số liệu đo lường. Qua đó, luật PPC của sai số được
thiết lập, tạo ra nền tảng cho phép chứng minh chặt chẽ phương pháp bình phương
tối thiểu, qua đó PPC giúp khẳng định tính giá trị và tính tin cậy của phương pháp
bình phương tối thiểu. Các công trình của Adrain về PPC rất được quan tâm và
99
được Cleveland Abbe, một nhà khí tượng học Mỹ phát minh lại vào năm 1871. Dựa
vào sử dụng PPC, Abbe rất thành công trong công tác dự báo khí tượng thông qua
xử lí số liệu quan trắc. PPC vẫn chưa được nhìn nhận thống nhất như một luật hay
một mô hình có giá trị quy luật của thế giới khách quan, mà vẫn đóng vai trò một
công cụ. Sự hình thành khái niệm khó khăn và lâu dài cũng phản ánh tính đa dạng
và phức hợp và tính cơ bản của luật PPC. Vấn đề cơ bản lúc này không còn là khám
phá tính quy luật của các đại lượng ngẫu nhiên nữa, mà là làm sao giải thích tính
quy luật của các đại lượng ngẫu nhiên. Điều cơ bản là chỉ ra điều kiện cơ sở để xây
dựng PPC về mặt lí thuyết và chỉ ra giới hạn áp dụng giả thuyết PPC trong
ứng dụng.
Các nhà khoa học tin tưởng vào tính quy luật của đại lượng ngẫu nhiên đã
được khám phá, tìm cách mở rộng quy mô ứng dụng và suy rộng các tính chất của
hệ cơ học sang hệ thống xã hội của con người. Do thiếu sót cơ sở xây dựng PPC
dẫn đến sai lầm trong ứng dụng, các nghiên cứu này ban đầu cũng không tránh khỏi
sơ xuất.
Năm 1835, nhà TK xã hội học đầu tiên là Adolphe Quételet, được coi là cha
đẻ của ngành khoa học xã hội định lượng, nêu lên khái niệm con người trung bình,
nhằm nghiên cứu con người ở tầm vĩ mô, trong đó khái niệm PPC được sử dụng
cho rất nhiều phân phối từ các số liệu xã hội học. Quételet thành công ở tầm tiếp
cận vĩ mô nhưng thất bại ở tầm vi mô khi không thể rút ra suy luận cho con người
cá nhân cụ thể. Các chỉ số TK không thể giải thích đầy đủ tính chất được xét, cũng
không nhất thiết tương ứng với thực thể nào đó tồn tại trong tự nhiên và xã hội, con
người trung bình là một khái quát hóa sai lầm. Đặc biệt là thất bại của ông đưa đến
thành công mới cho PPC, khi các nhà vật lí lí thuyết đã sửa chữa sai lầm bằng cách
sử dụng điểm mạnh của các định luật Quételet và giảm thiểu điểm yếu khi áp dụng
mô hình ứng xử của xã hội tự do vào vật lí lí thuyết các khí lí tưởng và phát triển
vật lí TK.
Trong nhân chủng học, nhà di truyền học và khí tượng học Francis Galton
(1888) đã phát minh phương pháp hồi quy tuyến tính và phương pháp hệ số tương
100
quan, ông này cũng sai lầm trong phương pháp luận khi suy rộng kết quả vật lí học
đem áp dụng vào nghiên cứu não tướng học. Tuy rằng suy luận TK dựa vào DL, XS
dựa vào giả thuyết, nhưng kết quả XS được chứng minh là đúng, còn suy luận TK
có thể sai nên không có sự thật tuyệt đối mà chỉ đề cập đến mức ý nghĩa. Sự sai lầm
do pha trộn lẫn giữa yếu tố thiếu sót về giả thuyết XS và mức có ý nghĩa TK bắt
nguồn từ sự thiếu sót cơ sở của PPC. Thiếu sót này là về tri thức luận chứ không về
toán học, các kết quả toán học được sử dụng đều phải được chứng minh. Galton để
lại nhiều đóng góp có ý nghĩa, mô hình Quincunx vẫn được dùng trong DH XS-TK,
đặc biệt là các thuật ngữ chuyên môn TK y sinh học mang đậm dấu ấn của ông.
Các tư tưởng cách mạng trong vật lí TK được dấy lên qua đột phá của
Bolzman và Maxwell. Năm 1860, Maxwell nêu lên luật phân phối Maxwell: “Khi
2
N
− x 2 dxα
e
1 π 2
tổng số hạt là N thì số các hạt chuyển động phân bố theo một hướng, nằm giữa x và
x + dx, là .
Nghiên cứu của Maxwell khẳng định rằng PPC không chỉ là một công cụ toán
học phổ biến mà còn là một luật chi phối các hiện tượng tự nhiên, đồng thời là mô
hình cho nhiều lớp hiện tượng có thể được mô tả chính xác dựa vào phân phối ấy.
Thông qua định luật số lớn, PPC là một mô hình xấp xỉ đơn giản cho nhiều hiện
tượng phức tạp, và là một giả thuyết áp dụng cho những lớp mô hình ứng dụng khác
có xu hướng tập trung quanh một giá trị trung bình và giảm nhanh đột ngột khi ra xa
giá trị trung bình.
Vào những năm cuối thế kỉ XIX, khái niệm PPC đã hoàn chỉnh và tìm được
ứng dụng rộng lớn. Phương pháp toán học có giá trị sâu sắc lại được thừa kế và phát
triển mạnh, qua đó PPC tìm được vị trí mới và được khẳng định đúng đắn hơn, mỗi
lần lại vững chắc và xuất sắc hơn trước. Sang thế kỉ XX, sau khi khẳng định vai trò
quan trọng và nội dung phong phú, PPC được thống nhất tên gọi. Karl Pearson
(1900), người phát minh ra KĐ chi bình phương cho phân phối theo bảng
contingency, là người đóng lại một thời kì đầy phức tạp và mở ra một thời kì mới
với trật tự. Trước Pearson, các nhà nghiên cứu ở nhiều lĩnh vực khác nhau cùng
101
phát triển phương pháp và kết quả nghiên cứu khoa học trên nhiều hướng đề cập
khác nhau tiến đến một cơ sở cho TK học, trong đó PPC trải qua rất nhiều đấu tranh
và nhiều thử thách trong nhiều lĩnh vực.
Năm 1894, ông đề xuất khái niệm độ lệch chuẩn. Năm 1900, ông phát minh
phương pháp chi bình phương để KĐ tính phù hợp giữa các phân phối. Năm 1920,
ông đề ra tên gọi PPC như ngày nay. Ông cũng là tác giả của các phân tích độ nhọn
của phân phối và họ đường cong Pearson. Cùng với trường phái Pearson, Yule
(1900, 1907) đã đem lại sự thống nhất cho TK phân tích khi tổng hợp được phương
pháp tương quan và hồi quy với phương pháp bình phương tối thiểu và lí thuyết sai
số vào năm 1897. Như vậy, không có gì lạ khi vai trò trung tâm quan trọng hàng
đầu của PPC được chứng minh và sử dụng. Yule cũng là người phát minh ra khái
2 µ σ= 0,
1
niệm tương quan bội và tương quan từng phần, trong đó PPC nhiều chiều là công cụ
= , được Hoel
không thể thiếu. Tên gọi “phân phối chuẩn tắc” cho PPC có
chỉ định vào năm 1947.
Những năm 1920 là thời kì then chốt cho TK học dựa trên lí thuyết XS. Đây
cũng là thời kì kinh tế tư bản chủ nghĩa phát triển, cùng với nó là sự thay đổi mạnh
mẽ về tư tưởng. Trong giai đoạn này, tư tưởng kinh tế học mới do John Maynard
Keynes (1921) đề xuất dựa trên xây dựng khái niệm XS dựa vào niềm tin và liên kết
với hành vi của cá nhân thực thể kinh tế đã đem lại hình ảnh mới cho PPC, với vai
trò là tiếng ồn hay tác động tổng hợp của các nhân tố trong hệ thống phức hợp tạo ra
sự giao thoa tác động và tính bất định. Nhà TK vĩ đại nhất thế kỉ Ronald Fisher
(1974), đồng thời là nhà di truyền học, đã thay đổi lịch sử, đem lại bước ngoặt phát
triển cho ngành phân tích TK. Phương pháp KĐ ý nghĩa TK của Fisher kết hợp với
KĐ giả thuyết TK của Pearson là mô hình cơ sở của nghiên cứu lâm sàng.
Câu chuyện về PPC đã và đang tiếp diễn sẽ còn tiếp tục, khái niệm PPC ngày
càng tìm thêm ứng dụng sâu sắc hơn. Trong những năm 50, lí thuyết của quá trình
ngẫu nhiên phát triển mạnh, PPC được sử dụng lại và phát triển mở rộng dưới nhiều
tên gọi khác nhau mô tả những quá trình ngẫu nhiên: PPC nhiều chiều, quá trình
Gauss, chuyển động Brown, v.v. Nhiều ứng dụng sâu vào các chuyên ngành hẹp
102
của toán học như lí thuyết số được triển khai cũng dựa trên PPC. Sự thống nhất này
là tất yếu của một quá trình mở rộng, phát triển mạnh mẽ khái niệm PPC.
3.2.2. Các giai đoạn nảy sinh và phát triển
Theo Thomas Kuhn, trong mỗi giai đoạn phát triển của khoa học, kiến thức
được tổ chức theo khuôn mẫu khoa học, đó là bộ khung của những quan điểm được
công nhận về đối tượng được nghiên cứu. Tiến trình phát triển của khoa học có
những giai đoạn đan xen của sự phát triển tích lũy dần dần và nhảy vọt cách mạng,
tại những điểm nhảy vọt là những công trình khám phá có tính cách mạng thay đổi
khuôn mẫu cũ tạo nên bước ngoặt phát triển, tại đó bắt đầu những bước đột phá
tư tưởng.
Trong trường hợp riêng của lịch sử hình thành phát triển khái niệm PPC,
chúng tôi nhận thấy có những giai đoạn nhảy vọt mang tính cách mạng. Sự nhảy vọt
thứ nhất diễn ra với Gauss và Laplace, tạo ra tiền đề cơ sở toán học cho khái niệm,
đây chính là sự khai sinh của khái niệm. Sự khai sinh khái niệm về mặt toán học
này gắn liền với bước nhảy vọt về đối tượng phương pháp từ lí thuyết XS sang lí
thuyết TK. Sự nhảy vọt thứ hai diễn ra với Pearson, khái niệm được chuẩn hóa với
tên gọi hiện đại, kiến thức được tổ chức theo chuẩn mực của một khoa học TK độc
lập với các ngành khác, đây là sự khai sinh lần thứ hai của khái niệm, song hành với
sự khai sinh ngành khoa học nó được vinh dự phục vụ, phân tích TK có cơ sở vững
vàng, tách khỏi TK mô tả. Vì vậy ở đây sự phân chia các giai đoạn hình thành và
phát triển khái niệm phụ thuộc vào quan điểm của nhà nghiên cứu, khi nhìn PPC
như khái niệm thuần túy toán học được phát triển trong tiến hóa các ngành toán học,
hay là một khái niệm TK học được gieo mầm và lớn lên trong liên ngành phức hợp
toán học, cơ học, xã hội học, v.v để khai sinh như khái niệm trung tâm của
XS-TK học.
3.2.2.1. Giai đoạn những năm 1730 đến 1770
Trong giai đoạn này, PPC mới được phát hiện và mang tính công cụ. TK ứng
dụng giai đoạn này cũng thô sơ, chủ yếu là các vấn đề dân số và nhân khẩu. Vì vậy
PPC được đề cập đến trong các kĩ thuật tính toán, chưa có dáng vẻ một vấn đề toán
103
học, không được coi là đối tượng để phát triển nghiên cứu, cũng không được đặt
tên. PPC xuất hiện dưới hình thức công cụ tính toán đại số, chưa thật sự là một đối
tượng toán học được hình thành bằng phương pháp giải tích toán học. Về mặt khái
niệm, PPC chỉ được xem như một luật hàm sinh xấp xỉ liên tục các hệ số nhị thức
Newton rời rạc, do đó phụ thuộc rất nhiều vào ý thích của các nhà nghiên cứu, chưa
được xem như một công cụ toán học trợ giúp cho các nghiên cứu ứng dụng và các
tính toán khoa học. Vì chưa phải là một đối tượng toán học, PPC chưa được nghiên
cứu sâu về toán học, thêm nữa mối liên quan của PPC với định lí giới hạn trung tâm
và phương pháp bình phương tối thiểu chưa được xác định rõ ràng. Phương pháp
bình phương tối thiểu cũng mới ra đời, chưa được khẳng định là phương pháp chủ
chốt của tính toán khoa học và các ngành khoa học ứng dụng. Định lí giới hạn trung
tâm cũng được chứng minh dựa vào ý tưởng khai thác phương pháp này và mở rộng
cho các bài toán cơ học.
3.2.2.2. Giai đoạn những năm 1780 đến 1860
Khoa học thực nghiệm phát triển mạnh, các nhu cầu đo lường và xử lí số liệu
cũng tăng lên. Giải tích toán học là môi trường tồn tại và phương pháp khai thác sức
mạnh ứng dụng của PPC. Bên cạnh việc phục vụ tính toán xấp xỉ, PPC có vai trò
kép, vừa là một phân phối của kết quả quan trắc vừa là một phân phối dùng làm
chuẩn để so sánh kết quả. Trong giai đoạn này, PPC đã qua tích lũy mà được sử
dụng rộng rãi, có nhiều đóng góp quan trọng trong nhiều lĩnh vực tính toán khoa
học như lí thuyết đo lường, vật lí thiên thể, khí động học. Về mặt lí thuyết, PPC
được sử dụng trong phép chứng minh chặt chẽ và là một công cụ tính toán trợ giúp
cho phương pháp bình phương tối thiểu và lí thuyết đo lường hiệu chỉnh sai số. Vị
trí trong toán học như một phân phối XS liên tục cơ bản nhất được chứng minh nhờ
định lí giới hạn trung tâm, theo đó trong những điều kiện nhất định, tổng các biến
ngẫu nhiên có trung bình và độ lệch chuẩn hữu hạn tiến đến tiệm cận PPC khi số
biến tăng.
Phương pháp bình phương tối thiểu và lí thuyết sai số đạt được vị trí quan
trọng, được sử dụng rộng rãi trong ứng dụng, được chứng minh chặt chẽ về mặt
104
toán học. Đây chính là thời cơ để PPC được xem xét như một đối tượng toán học.
Đây cũng là thời kì này nảy sinh nhiều vấn đề xung quanh PPC. Lí thuyết tương
quan và hồi quy là một mảng phát triển rất mạnh và giàu tính ứng dụng thực tiễn
cũng như ý nghĩa phương pháp luận khoa học, được phát triển đã khẳng định vai trò
trung tâm của PPC. Trong giai đoạn này PPC được biết đến và khai thác dưới nhiều
khía cạnh, đặt tên theo khía cạnh được khai thác. Các nhà nghiên cứu không thống
nhất ý kiến về khái niệm và biểu diễn công thức của PPC. PPC xuất hiện dưới nhiều
cái tên khác nhau như luật sai số, luật Gauss, luật Laplace, tùy theo mối quan tâm
và lĩnh vực của các chuyên gia.
3.2.2.3. Giai đoạn cuối thế kỉ 18 đến 1920
Khái niệm PPC đã được phát triển trong khung lí thuyết toán học nhất quán và
chặt chẽ, vai trò của PPC được chứng minh qua thực tế ứng dụng. PPC trở thành
công cụ quan trọng được ứng dụng hết sức đa dạng trong nhiều lĩnh vực khoa học,
không những trong nội bộ toán học mà cả các ngành khoa học tự nhiên, xã hội và
con người. Bước phát triển mới liên kết, thống nhất phương pháp hồi quy tương
quan với phương pháp bình phương tối thiểu và lí thuyết sai số đem lại ý nghĩa và
phương pháp phân tích TK hiện đại, qua đó khẳng định vai trò của PPC. TK phân
tích và TK tham số đã khẳng định được vị trí, tạo phân ngành đa dạng trong nội bộ
TK học, tạo tiền đề cho TK phi tham số. Việc không sử dụng giả thuyết PPC không
phải là sự phủ định vai trò của PPC, mà chỉ nêu lên giới hạn của phổ khái niệm.
Điều này hợp quy luật phát triển.
Ngành khoa học TK mới ra đời, ngành toán học cũng được hưởng lợi ích và đang
tích lũy để nhảy vọt với cuộc cách mạng do Kolmogorov khởi xướng vào những
năm 1930.
Tên gọi PPC cũng được quy định thống nhất. Từ đây những dạng mở rộng của PPC
được nghiên cứu và ứng dụng rộng rãi, PPC nhiều chiều liên quan đến tương quan
đa bội và hồi quy đa bội.
105
3.2.3. Phạm vi tác động, bài toán và đối tượng liên quan
3.2.3.1. Phạm vi tác động
PPC có phạm vi tác động rất lớn và trở nên phổ biến trong khoa học tự nhiên,
kĩ thuật và khoa học xã hội nhân văn từ lí thuyết đến ứng dụng.
Luật PPC tỏ ra phù hợp chính xác với nhiều định luật của tự nhiên. Hầu hết
các hiện tượng tự nhiên được mô tả bằng luật PPC hay được chuyển biến mô tả để
tuân theo luật PPC. Luật PPC được xấp xỉ cho nhiều lớp hiện tượng, nhiều áp dụng
định lí giới hạn trung tâm và đánh giá sai số theo giải tích toán trong y sinh học, kĩ
thuật. Luật PPC là nền tảng của các phân tích TK, là mô hình cho nhiều phân phối
XS khác. Các bài toán KĐ TK tham số không thể giải quyết được nếu thiếu giả
thuyết về PPC của quần thể khảo sát.
3.2.3.2. Các bài toán liên quan
Các bài toán liên quan đến PPC được phân chia theo phạm vi tác động.
- Sự hình thành PPC: phân phối nhị thức, luật số lớn, luật giới hạn phân phối, xử lí
sai số đo đạc và bình phương tối thiểu.
- Sự mở rộng PPC: PPC đa chiều với các vector ngẫu nhiên
- Ứng dụng của PPC:
Trong XS-TK, các bài toán liên quan bao gồm: KĐ giả thuyết TK, ước lượng
tham số và thiết kế nghiên cứu.
Trong mô hình toán học: Tiếng ồn trắng, mô hình dân số dưới tác động ngẫu
nhiên của môi trường, mô hình dòng điện dưới tác động ngẫu nhiên trong mạng
điện, mô hình Black - Sholes
Trong toán học thuần túy: Lí thuyết số và tổ hợp, luật phân phối số nguyên tố.
Trong vật lí: Mô hình và lí thuyết khí lí tưởng, mô hình và lí thuyết chuyển
động Brown, lí thuyết đo lường và sai số, v.v.
Trong khoa học xã hội: Thiết kế nghiên cứu, xử lí và phân tích số liệu, ước
lượng tham số, KĐ TK, v.v.
106
3.2.3.3. Các đối tượng có liên quan
Sự hình thành và phát triển của khái niệm PPC có liên quan chặt chẽ đến các
công cụ và phương pháp giải tích toán học, khung khái niệm và lí thuyết của XS và
TK. Các đối tượng toán học được đề cập đến chủ yếu và được phân chia theo hai
loại tri thức, nhằm tổ chức khung tri thức cho việc dạy và học.
- Hàm số: Hàm của tập (biến ngẫu nhiên), hàm của hàm (hàm của biến ngẫu nhiên),
hàm đặc biệt (hàm mật độ XS, hàm tích lũy XS, hàm moment, hàm Gauss), hàm
định nghĩa bằng tích phân (tích phân Gamma, PPC, phân phối Student, phân phối
chi bình phương, phân phối Fisher).
- Không gian và topo: Không gian mẫu, không gian XS, không gian tham số
- Phép tính vi tích phân: Độ đo XS, phép tính tích phân định hạn, phép tính tích
phân mở rộng, tích phân Laplace, tích phân entropy, tin lượng Fisher.
3.3. KẾT LUẬN CHƯƠNG 3
Thông qua phân tích các kết quả nghiên cứu lịch sử toán học, phân tích quá
trình hình thành và phát triển của KĐ giả thuyết TK và PPC, chúng tôi đã chỉ ra một
số đặc trưng tri thức luận cơ bản trong từng thời kì, từ đó xây dựng nên bức tranh
đại cương thống nhất về lịch sử của khái niệm.
Phân tích đó cho thấy, trong lịch sử xây dựng và phát triển, bài toán KĐ giả
thuyết TK đã được tiếp cận theo những mô hình khác nhau. Fisher không đưa ra giả
thuyết H1 (đối thuyết của H0) và theo ông thì không thể nói là bác bỏ hay chấp
nhận H0 mà chỉ có thể kết luận là số liệu có phù hợp với H0 hay không. Đứng ở góc
độ người nghiên cứu toán học – khoa học chỉ thừa nhận những gì được chứng minh
chặt chẽ bằng suy diễn, thì quan niệm này là chuẩn xác về phương pháp luận. Tuy
nhiên nó lại không giải quyết được bài toán KĐ, ở đó người ta cần dựa vào mẫu để
đưa ra một nhận định về tổng thể (với một độ tin cậy nào đó). Mô hình của Neyman
và Pearson dường như quán triệt tinh thần này, khi họ cho rằng cần phải đưa ra một
quyết định, và vấn đề là phải xây dựng quy trình hợp lý có luật bác bỏ/chấp nhận và
có đánh giá khả năng sai lầm của quyết định đã chọn. Tuy nhiên, mô hình của
Neyman và Pearson vẫn không hoàn toàn được cộng đồng các nhà nghiên cứu chấp
107
nhận: họ tranh luận về việc kết quả có đáng tin cậy hay không với phương pháp của
hai ông. Mãi đến cuối thế kỷ 20, một lý thuyết lai giữa hai mô hình KĐ mới chính
thức được đề xuất và ngày nay nó được xem như một mô hình phù hợp trong nghiên
cứu y học.
Phân tích tri thức luận lịch sử cũng đã chỉ ra vai trò của PPC trong XS – TK
nói chung, trong việc giải quyết bài toán KĐ giả thuyết TK nói riêng. Kết quả phân
tích có thể là những yếu tố mà chúng tôi dùng trong thiết kế DH KĐ giả thuyết TK
và PPC.
Phân tích trên còn cho thấy những khó khăn, chướng ngại, thậm chí sai lầm
mà các nhà khoa học đã gặp phải trong quá trình khám phá và sử dụng tri thức này.
Sự sai lầm do pha trộn giữa yếu tố thiếu sót về giả thuyết XS và mức có ý nghĩa TK
bắt nguồn từ thiếu sót cơ sở của PPC. Mặt khác, vì các nhà khoa học tin tưởng vào
tính quy luật của đại lượng ngẫu nhiên đã được khám phá, tìm cách mở rộng quy
mô ứng dụng và suy rộng các tính chất của hệ cơ học sang hệ thống xã hội của con
người như Adolphe Quetele hoặc Francis Galton đã sai lầm trong phương pháp luận
khi suy rộng kết quả vật lý học để áp dụng nghiên cứu não tướng học.
Những sai lầm đã gặp phải khi sử dụng KĐ giả thuyết TK và PPC của các nhà
khoa học có thể lặp lại đối với SV ? Có sự chuyển đổi sư phạm từ tri thức cần dạy
đến tri thức được dạy hay không, … là những câu hỏi mà chúng tôi mong muốn tìm
câu trả lời trong các chương 4 và 5 tiếp theo.
108
CHƯƠNG 4
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
VÀ PHÂN PHỐI CHUẨN: MỘT NGHIÊN CỨU THỂ CHẾ
Mục đích và phương pháp nghiên cứu
Phân tích tri thức luận về đối tượng tri thức O - KĐ giả thuyết TK và PPC ở
chương 3 cho thấy trong bài toán KĐ về giá trị của một tham số λ nào đó, vấn đề là
chấp nhận hay bác bỏ giả thuyết H0: Điều đó đồng nghĩa với việc bác bỏ hay chấp
nhận đối thuyết HA. Lưu ý rằng đối thuyết HA có ba dạng: λ ≠ λ0, λ > λ0, λ < λ0.
Dạng thứ nhất gọi là giả thuyết hai đuôi, hai dạng còn lại gọi là giả thuyết một đuôi.
Phân tích tri thức luận cũng đã cho thấy tính chuẩn của DL là một điều kiện
quan trọng trong bài toán KĐ. Chính các nhà khoa học cũng đã phạm phải những
sai lầm do thiếu sót về giả thuyết XS và mức có ý nghĩa TK bắt nguồn từ sự thiếu
sót cơ sở của PPC.
Trong chương này chúng tôi thực hiện phân tích các đặc trưng của quan hệ thể
chế đối với đối tượng O. Thể chế mà chúng tôi quan tâm là thể chế DH XS-TK ở
Đại học Y dược Tp HCM. Trong phần dưới, chúng tôi sẽ dùng chữ cái IV để chỉ thể
chế này.
Mục đích của chương hướng đến việc tìm kiếm câu trả lời cho các câu hỏi đã
đặt ra ở cuối chương 3: Liên quan đến tri thức O, SV Đại học Y Dược Tp HCM có
thể gặp phải những sai lầm gì? Những sai lầm này có nguồn gốc từ bản chất tri thức
luận, từ sự chuyển đổi sư phạm hay do hợp đồng DH ?
Để hiểu rõ IV hơn, việc nhìn sang một thể chế khác sẽ rất có ích, vì nó cho
phép ta làm rõ những gì có thể tồn tại nhưng đã không tồn tại trong IV. Phương
pháp nghiên cứu so sánh này đã từng được nhiều luận án sử dụng. Thể chế thứ hai,
ký hiệu bởi chữ cái IF, mà chúng tôi chọn để so sánh là thể chế DH XS-TK ở
trường Đại học Y - Đại học Grenoble, cộng hòa Pháp. Sự lựa chọn này được thực
hiện do chúng tôi là một thành viên nghiên cứu của dự án hợp tác giữa Đại học Y
Dược Tp. HCM và Đại học Grenoble về vấn đề DH XS-TK cho SV ngành y.
109
Một số kết quả điều tra thực tiễn trong khuôn khổ của dự án cho thấy việc
DH XS – TK của IF vẫn chưa đáp ứng được đòi hỏi của thực tiễn: SV thiếu động cơ
học môn XS – TK và chưa đạt được những kỹ năng cần có để thực hiện một nghiên
cứu y học. Kết quả này khiến chúng tôi muốn tìm hiểu thêm một thể chế thứ ba. Với
tư liệu tìm được, chúng tôi chọn đó là thể chế DH XS – TK ở Đại học Y, thuộc Đại
học Nam Illinois (Southern Illinois University), Hoa Kỳ. Chúng tôi gọi thể chế này
là IA.
Như đã nói trong Chương 1, cơ sở quan trọng để chỉ ra các đặc trưng của
quan hệ thể chế là những chỉ thị, văn bản chính thức quy định về chương trình, mục
đích DH và những giáo trình phục vụ cho việc DH.
Ở đây, đối với IV chúng tôi sẽ phân tích giáo trình Xác suất – Thống kê và
cuốn sách bài tập đi kèm, do các tác giả Chu Văn Thọ, Phạm Minh Bửu, Trần Đình
Thanh, Nguyễn Văn Liêng viết (hai trong số ba tác giả là GV toán của Đại học Y
Dược Tp HCM, một tác giả khác là GV – bác sĩ nhưng có bằng cử nhân toán).
Chúng tôi sẽ gọi hai cuốn sách này lần lượt là V1, V2. Đối với IF chúng tôi dựa vào
giáo trình Biostatistique của Bénichou, R. Beusccart, P. Roy, C. Quantin (2009),
được sử dụng ở Đại học Grenoble. Tài liệu cho việc phân tích quan hệ của thể chế
IA với đối tượng O là cuốn Basic & Clinical Biostatistics của Beth Dawson, Robert
G. Trapp (2004). Để thuận tiện trong phân tích, chúng tôi lần lượt ký hiệu hai giáo
trình Biostatistique và Basic & Clinical Biostatistics là F và A.
Khi phân tích quan hệ thể chế, chúng tôi sẽ chỉ ra lý do tồn tại của O, những
kiểu nhiệm vụ nào đã được đưa vào và những kỹ thuật nào liên quan đến O đã được
ưu tiên sử dụng. Điều đó giúp chúng tôi làm rõ những gì mà thể chế mong đợi ở SV
khi họ thao tác trên O.
Theo quan điểm của Thuyết nhân học trong Didactic Toán thì nghiên cứu
quan hệ thể chế sẽ cho phép dự đoán được quan hệ cá nhân của hai thành phần chủ
chốt – GV và SV đối với O: họ nghĩ về O như thế nào, sử dụng O ra sao, có thể
phạm phải những sai lầm gì, ...? Nói cách khác, phân tích đó giúp ta trả lời câu hỏi:
trong DH XS-TK, yếu tố đào tạo nghề đã được tính đến như thế nào bởi IV ?
110
Giới hạn trọng tâm phân tích: Trong khuôn khổ có hạn của luận án, chúng
tôi giới hạn trọng tâm vào KĐ giả thuyết TK về so sánh hai tỷ lệ và so sánh hai
trung bình thực nghiệm độc lập. Lý do thứ nhất là nội dung này chiếm vị trí quan
trọng trong chương KĐ giả thuyết TK. Lý do thứ hai: đây là bài toán thường xuyên
gặp trong các nghiên cứu y học. Lý do thứ ba của sự lựa chọn này liên quan đến ý
đồ xây dựng một đồ án DH, ở đó chúng tôi lấy KĐ giả thuyết TK về so sánh hai
trung bình làm đối tượng nghiên cứu.
A. QUAN HỆ CỦA THỂ CHẾ Iv VỚI O
4.1. XS-TK TRONG CHƯƠNG TRÌNH ĐÀO TẠO NGÀNH Y
4.1.1. XS-TK trong chương trình khung do Bộ Giáo dục và Đào tạo quy định
Trong quyết định ban hành tháng 4 năm 2001 về đào tạo đại cương theo 7
nhóm ngành thuộc ngành Khoa học sức khỏe của Bộ Giáo dục và Đào tạo, tất cả
các nhóm ngành đều có môn học XS - TK với thời lượng ít nhất là 3 đơn vị học
trình (45 tiết). Chương trình khung của Bộ Giáo dục và Đào tạo ban hành năm 2001
đối với ngành đào tạo bác sĩ đa khoa được Bộ Giáo dục và Đào tạo và Bộ Y tế
thống nhất thực hiện ở tất cả các trường/ khoa có đào tạo bác sĩ đa khoa.
- Việc triển khai chi tiết thực hiện chương trình và giám sát chất lượng chuyên môn do
Bộ Y tế chỉ đạo thực hiện.
- Phần nội dung chương trình bắt buộc các trường giảng dạy đủ khối kiến thức đã quy
định trong đó phần XS - TK được gọi tên chung là TK y học với thời lượng 3 đơn vị
học trình (45 tiết).
- Trên cơ sở chương trình khung đã được Bộ Giáo dục và Đào tạo phê duyệt, các
trường sắp xếp chương trình và triển khai thực hiện.
- Môn học này nằm trong phần kiến thức cơ sở của khối ngành.
(Bộ Giáo dục và Đào tạo, 2001)
Về yêu cầu, chương trình nêu rõ:
Năm 2012, Bộ Giáo dục và Đào tạo đưa ra một chương trình khung mới, trong
đó môn XS-TK đổi thành môn XS-TK Y học đối với ngành Y, Toán TK Y dược đối
với ngành Dược. Số đơn vị học trình là 3 cho ngành thứ nhất, 4 cho ngành thứ hai.
111
4.1.2. Chương trình XS-TK ở Đại học Y dược Tp HCM
Hiện nay, Đại học Y dược Tp HCM chưa thực hiện DH theo học chế tín chỉ.
Về XS-TK, chương trình của trường tuân thủ quy định của Bộ Giáo dục và Đào tạo
về số đơn vị học trình cũng như về tên gọi môn học.
XS-TK của Đại học Y dược Tp HCM được giảng dạy ở học kỳ I năm thứ nhất
với các hệ đào tạo như sau:
- Hệ chính quy 6 năm dành cho đào tạo bác sĩ (Đa khoa, Răng hàm mặt, Y học cổ
truyền, Y học dự phòng), Dược sĩ: 45 tiết; Cử nhân (Xét nghiệm, Điều dưỡng, Y tế
công cộng, Kỹ thuật hình ảnh, Kỹ thuật phục hình răng, Vật lý trị liệu, Gây mê hồi
sức, Nữ hộ sinh): 45 tiết
- Hệ Liên thông đào tạo Cử nhân (Xét nghiệm, Điều dưỡng, Y tế công cộng, Kỹ
thuật hình ảnh, Kỹ thuật phục hình răng, Vật lý trị liệu, Gây mê hồi sức, Nữ hộ
sinh), Dược: 45 tiết; Y học cổ truyền: 30 tiết.
Từ năm 2011 trở về trước, trước khi học học phần XS-TK ở học kỳ II năm thứ
nhất, SV đã được học học phần toán cao cấp ở học kỳ I. Học phần toán cao cấp
trang bị cho SV những kiến thức cơ bản về vi tích phân và những ứng dụng của
khối kiến thức này trong Y học. Đặc biệt, các kiến thức này hỗ trợ hầu hết các
chứng minh, suy diễn trong XS-TK nên nó được coi là học phần tiên quyết đối với
học phần XS-TK. Tuy nhiên, từ năm học 2011 - 2012, đã có những thay đổi sau:
- Học phần toán cao cấp đã được cắt bỏ, vì thế SV phải tự trang bị kiến thức nền
tảng về giải tích, GV không thể cung cấp những kiến thức liên quan đến giải tích
được sử dụng trong học phần XS-TK do thời lượng có hạn của chương trình.
- Tên học phần “Xác suất thống kê” được đổi thành “Toán xác suất và thống kê
y học”
Chương trình XS-TK (45 tiết) được Bộ môn Toán – Khoa Khoa học Cơ bản
Đại học Y dược Tp.HCM phân bổ cụ thể trong Bảng 4.1
112
Bảng 4.1. Phân phối chương trình XS-TK
[Nguồn: Bộ môn Toán, 2011]
Chương trình trên được cấu tạo thành ba phần: 5 chương đầu dành cho phần
XS, 5 chương tiếp theo trình bày các kiến thức của TK, chương cuối cùng tập trung
bàn về một số ứng dụng cơ bản của XS trong chẩn đoán.
Với chương trình đó, PPC và những ứng dụng của phân phối này trong XS,
ước lượng khoảng tin cậy và KĐ giả thuyết TK được giảng dạy trong 21 tiết bao
gồm những nội dung sau:
- Các phân phối XS thường dùng
- Ước lượng khoảng tin cậy: Ước lượng khoảng tin cậy cho trung bình, cho tỷ lệ
- KĐ giả thuyết TK: So sánh hai trung bình, so sánh hai tỷ lệ
Ở nội dung thứ nhất, thời lượng chủ yếu dành cho PPC với 3/5 tiết, còn lại là
các phân phối khác. Mục đích và yêu cầu về PPC đối với SV: “hiểu bản chất của
PPC và các ứng dụng của nó. Biết cách vận dụng PPC và xấp xỉ các phân phối rời
rạc thông dụng.” (Bộ môn Toán, 2011)
Ở nội dung thứ hai, ước lượng tham số của biến ngẫu nhiên có hai nội dung
chính là ước lượng điểm và ước lượng khoảng tin cậy. Trong đó, ước lượng khoảng
tin cậy chiếm 4 trong tổng số 5 tiết của phần lý thuyết ước lượng. Mục đích, yêu
cầu của chương trình phần ước lượng là “Phân biệt hai phương pháp ước lượng
điểm và ước lượng khoảng tin cậy, nắm vững các phương pháp ước lượng tham số
từ dữ liệu mẫu trong các trường hợp ước lượng khoảng tin cậy”. (Bộ môn Toán, 2011)
113
Với mục đích và yêu cầu như vậy cùng với số tiết được phân bổ của chương
trình, trong phần lý thuyết ước lượng, thể chế IV chỉ ưu tiên phần ước lượng khoảng
tin cậy. Điều này cũng thể hiện rõ trong giáo trình V1 ở chỗ tất cả các bài tập ước
lượng đều là ước lượng khoảng tin cậy.
Trong phần này, định lý giới hạn trung tâm có vai trò giải thích cho các biến
ngẫu nhiên có phân phối chuẩn tắc.
Ở nội dung thứ ba với 12 tiết, KĐ giả thuyết TK chiếm thời lượng lớn nhất về
số tiết so với các phần khác của chương trình. Các khái niệm cơ bản như giả thuyết
"không", các loại sai lầm trong KĐ, miền bác bỏ và miền chấp nhận giả thuyết đều
được nói đến ngay trong phần mở đầu chương. Liên quan đến PPC có hai nội dung
chủ yếu: So sánh hai trung bình và so sánh hai tỷ lệ. Trong phần KĐ giả thuyết TK,
một lần nữa định lý giới hạn trung tâm có vai trò quan trọng trong việc giải thích
các biến ngẫu nhiên có phân phối chuẩn tắc.
- Hiểu được các ứng dụng liên quan đến XS-TK khi học các môn chuyên ngành.
- Áp dụng được XS-TK để xử lý một số bài toán chuyên ngành
- Mở rộng kiến thức về XS-TK để xử lý một số bài toán chuyên ngành trong nghiên
cứu. (Bộ môn Toán, 2011)
Về mục đích yêu cầu của môn học, chương trình nói rõ:
Như vậy, theo sự phân bổ của chương trình thì PPC và KĐ giả thuyết TK có
vai trò quan trọng. Điều này không chỉ thể hiện ở số tiết được dạy mà còn thể hiện
thông qua những nội dung được đề cập.
Yếu tố đào tạo nghề cũng đã được tính đến trong chương trình, đó là sự hiện
diện của phần lớn các bài toán trong thực tế nghề nghiệp thể hiện trong các ví dụ và
bài tập trong V1, V2. Vấn đề này chúng tôi sẽ làm rõ trong phần phân tích tiếp theo.
4.2. PHÂN TÍCH GIÁO TRÌNH V1 VÀ SÁCH BÀI TẬP V2
Như đã nói, V1 là giáo trình "Xác suất Thống kê" và V2 là cuốn bài tập đi
kèm, do Đại học Y Dược Tp HCM xuất bản. Đây là giáo trình được dùng trong
giảng dạy và học tập của IV. Việc tham khảo cuốn bài tập V2 giúp chúng tôi làm rõ
hơn những tổ chức toán học đã được đưa vào V1 và những kỹ thuật mong muốn,
được ưu tiên trong thể chế IV.
114
Với việc phân tích giáo trình, chúng tôi cố gắng làm rõ “cuộc sống” của KĐ
giả thuyết TK và PPC trong IV: chúng xuất hiện qua những kiểu tình huống nào,
những kiểu nhiệm vụ nào đã được đưa vào và những kỹ thuật nào liên quan đã được
ưu tiên sử dụng.
Trọng tâm của phân tích quan hệ thể chế được chúng tôi đặt vào KĐ giả thuyết
TK. Liên quan đến đối tượng này, phân tích ở chương 3 đã chỉ ra điều kiện không
thể bỏ qua là tính chuẩn của DL. Những kiến thức về PPC được trình bày trước hết
trong phần XS với mục đích cung cấp kiến thức cần thiết cho SV khi cần giải quyết
các bài toán của TK, đặc biệt là bài toán KĐ mà chúng tôi quan tâm. Cũng vì thế
nên trước khi xem xét đối tượng KĐ giả thuyết TK trong V1, chúng tôi sẽ phân tích
sự tồn tại của đối tượng tri thức PPC được trình bày trước đó - phần XS.
4.2.1. PPC trong XS
PPC (cũng như các loại phân phối khác) là một khái niệm được đưa vào để
nghiên cứu các đại lượng ngẫu nhiên. Nếu X là một đại lượng ngẫu nhiên có thể
nhận những giá trị thuộc một tập rời rạc và hữu hạn {x1, x2, …, xn} thì người ta
dùng bảng phân phối XS (Bảng 4.2) để nghiên cứu nó. Bảng này có dạng:
≥
Bảng 4.2. Bảng phân phối XS của biến ngẫu nhiên X
0 =
∑
1
p i p i
trong đó pi = P[X = xi] và các giá trị pi thỏa mãn điều kiện:
Nếu X là đại lượng ngẫu nhiên liên tục thì người ta không lập bảng phân phối
XS mà sẽ nghiên cứu nó thông qua hàm mật độ XS. Hàm này được định nghĩa là
∀ x
≥ ( ) 0 f x +∞
=
f x dx ( )
1
∫
−∞
b
≤
hàm thỏa mãn điều kiện:
≤ P a X b
(
)
f x dx ( )
= ∫
a
Trong trường hợp này ta có công thức:
115
Liên quan đến phân tích của chúng tôi ở dưới còn có khái niệm trung bình,
phương sai, độ lệch chuẩn và hàm phân phối tích lũy của biến ngẫu nhiên X.
Trung bình của biến ngẫu nhiên X, kí hiệu E(X) hay µ, được định nghĩa là:
2
=
=
−
V
ar(
X
)
E X (
µ )
Phương sai của biến ngẫu nhiên X, ký hiệu σ 2, là đại lượng chỉ mức độ phân
2σσ =
=
≤
tán của DL xung quanh giá trị trung bình, và 2 σ , còn độ lệch
)
)( xF
( XP
x
)( duuf
x ∫= a
chuẩn là . Hàm phân phối tích lũy của X là .
PPC được V1 trình bày trong Chương IV - Các phân phối thường dùng. Ở
đây, các phân phối XS thường dùng được đưa vào là: phân phối Bernoulli, phân
phối nhị thức, phân phối Poisson, PPC, phân phối chi bình phương, phân phối
Student và phân phối Fisher. Trong số các phân phối XS này, PPC thuộc loại phân
phối liên tục. Nó được trình bày chi tiết hơn các phân phối khác cả về phần lý
thuyết cũng như những ứng dụng và các bài tập liên quan (10 trên tổng số 20 bài tập
của chương).
Ta biết rằng các phân phối của biến ngẫu nhiên X được định nghĩa thông qua
hàm mật độ của nó. Chẳng hạn, khái niệm PPC
Cho biến ngẫu nhiên U liên tục, U có phân
phối chuẩn (hay phân phối bình thường
chuẩn), ký hiệu
khi hàm mật
U N ~
(0,1)
2
−
u 2
=
độ có dạng:
( ) f u
e
1 π 2
Đồ thị f(u) có dạng hình chuông đối xứng qua trục tung. Diện tích giới hạn bởi trục
+∞
=
hoành và đường cong chính là
f u du ( )
1
[V1, tr.59]
∫
−∞
được định nghĩa như sau:
116
Khái niệm PPC được V1 đưa vào theo thứ tự: Hàm mật độ XS, dạng đồ thị và
≤
≤
=
φ
−
φ
Φ = ( ) u
P U a
(
)
≤ P a U b
(
)
b ( )
a ( )
tính chất của hàm mật độ XS f (u), sau cùng là định nghĩa về hàm tích lũy với chú ý
là và .
Sau khi trình bày định nghĩa về PPC, V1 đưa vào định nghĩa khái niệm phân
Cho biến ngẫu nhiên X liên tục, với
là hai thông số, X có phân phối bình
0,σ µ>
2
thường, ký hiệu
X N µσ khi hàm mật độ có dạng:
~
)
(
,
2
− − µ x ( ) 2 σ 2
=
với x R∈ .
f x ( )
e
1 σ π 2
Khảo sát hàm số
f x ta có đồ thị
( )
f x đối xứng
(C). Đường biểu diễn ( )
qua trục x µ= , cực trị phụ thuộc vào
σ, do đó dạng của (C) tùy thuộc vào
hai thông số µvà σ.
Đặc tính của biến ngẫu nhiên bình thường:
=
=
2 σ
=
+
EX
VarX
µ t
µ ,
,
M t ( )
exp
2 2 σ t 2
Vậy trong phân phối bình thường tham số µ và σ là trung bình và độ lệch chuẩn
[V1, tr.61-62]
phối bình thường.
Cách trình bày định nghĩa phân phối bình thường như trên cho thấy, phân phối
2
0µ= và phương sai
1σ = .
bình thường chuẩn là trường hợp đặc biệt của phân phối bình thường khi trung bình
Ở đây chúng tôi muốn lưu ý rằng thuật ngữ "Phân phối bình thường" được V1
2 µ σ= 0,
1
= , nhiều sách của Việt
dịch từ “Normal Distribution”, trong khi hầu hết các sách về XS - TK của Việt Nam
đều dịch từ này là PPC. Trường hợp đặc biệt, khi
Nam gọi là "Phân phối chuẩn tắc", thì V1 gọi là PPC. Trong luận án này, chúng tôi
dùng từ PPC theo nghĩa Normal distribution.
Phân phối chuẩn tắc có hàm mật độ đơn giản hơn PPC nên các tính toán cũng
dễ thực hiện hơn, vì thế người ta thường sử dụng các định lý sau để đưa một biến có
117
PPC hoặc phân phối nhị thức về phân phối chuẩn tắc. Các định lý này được phát
biểu tường minh trong V1:
Chuẩn hóa phân phối bình thường
Các mệnh đề sau đây giúp ta đưa về phân phối chuẩn, từ đó ta có thể tính xác suất các
biến cố cần thiết bằng cách dùng bảng số phân phối chuẩn.
µ
X
2
Định lý: Nếu
~
N
(0,1)
X N µσ thì ,
~
(
)
− σ
Định lý Moivre – Laplace: Nếu
khi n lớn.
X N np np (
~
,
(1
p−
))
X B n p thì
~ ( ,
)
[V1, tr.62-63]
V1 chú ý thêm về định lý Moivre – Laplace “Định lý nói rằng khi n lớn ta xấp
xỉ phân phối nhị thức bằng phân phối bình thường” (V1, tr. 63). Phần chú ý mà V1
≥
−
np
p
n 5, (1
đưa ra không nói rõ n lớn là bao nhiêu mà nêu điều kiện là: “Để xấp xỉ này được tốt
≥ ” (V1, tr. 63-64) ) 5
thì phải thỏa mãn các điều kiện sau: 0,1 < p < 0,9;
Phân phối bình thường giữ một vai trò quan trọng trong thống kê.
a. Rất thường gặp
Theo Borel, một biến ngẫu nhiên là kết quả của nhiều nguyên nhân, mỗi nguyên nhân
tác động một ít và không có nguyên nhân nào là quyết định, thì biến ngẫu nhiên đó có
phân phối bình thường.
Vậy:
- Các số đo về đặc tính sinh học: Chiều cao, cân nặng, huyết áp, nồng độ, … hầu như
có phân phối bình thường.
- Trong xã hội, số con trong một gia đình, sự lợi tức hàng năm, sản lượng một vụ mùa,
đơn vị diện tích,… tuân theo phân phối bình thường
- Sai số trong đo lường về vật lý cũng có phân phối bình thường.
b. Vai trò trung tâm
Như đã thấy, phân phối bình thường là giới hạn của phân phối nhị thức, phân phối
Poisson khi n lớn.
Một định lý gọi là định lý giới hạn trung tâm nói lên vai trò đặc biệt của phân phối
bình thường. [V1, tr.66]
Cuối cùng, V1 trình bày vai trò của phân phối bình thường:
118
Định lý giới hạn trung tâm được trình bày nhưng không chứng minh trong
1, X
2, …, X
n) rút từ một dân số có
µ
x
n
Chương VI - Lý thuyết mẫu như sau: “Với mẫu (X
2σ < ∞ , thì
− σ
trung bình µ, phương sai ~ N(0; 1) khi n → ∞” [V1, tr. 99]
V còn chú ý thêm rằng: “Định lý này rất quan trọng với người làm thống kê,
với mẫu lớn thì X gần như có phân phối bình thường, bất chấp đặc tính X trong dân
số có phân phối gì.” [V1, tr. 99]
Có thể việc đưa vào chú ý này là lý do để sau đó V1 không thực hiện KĐ đặc
tính X trong dân số có PPC hay không, ngay cả khi cỡ mẫu n < 30 khi đề cập đến
bài toán ước lượng khoảng tin cậy và KĐ giả thuyết TK về trung bình. V1 cũng
không cho biết cỡ mẫu bằng bao nhiêu được coi là mẫu lớn nhưng trong các bài
toán ở phần TK, V1 thường cho cỡ mẫu lớn khi n ≥ 30.
Chúng tôi sẽ phân tích kỹ hơn điều này trong các phần tiếp theo.
4.2.2. PPC trong ước lượng khoảng tin cậy
Ước lượng khoảng tin cậy và KĐ giả thuyết TK là hai bài toán có quan hệ mật
thiết với nhau. Trong bài toán một mẫu, nếu trung bình hoặc tỷ lệ lý thuyết nằm
trong khoảng tin cậy của trung bình hoặc tỷ lệ của dân số thì sự khác biệt giữa hai
đại lượng cần so sánh không có ý nghĩa TK và ngược lại. Trong bài toán hai mẫu
thực nghiệm nếu khoảng tin cậy chứa 0 thì sự khác biệt giữa hai đại lượng cần so
sánh không có ý nghĩa TK và ngược lại.
Trong phần này, V1 trình bày hai bài toán ước lượng: Ước lượng khoảng tin
cậy cho trung bình và cho tỷ lệ.
σ
µ= ±
x C
2σ thì khoảng tin cậy là
Về bài toán ước lượng khoảng tin cậy cho trung bình, V1 nêu 2 trường hợp:
n
với - Nếu đã biết phương sai
γ 2
µ= ±
x C
2σ và n < 30 thì khoảng tin cậy là
Φ(C) = ⇒ giá trị C theo PPC.
s n
1)
− theo phân phối Student.
nγ− (
- Nếu chưa biết phương sai
với C = 1 t
119
2σ . Chỉ có duy nhất một bài tập (tự giải) trong V2 có nêu ra trường
V1 không đưa ra một ví dụ hay bài tập (có lời giải) nào minh họa cho trường
hợp đã biết
Một phản ứng kết tinh chất A trong một quy trình sản xuất cho trung bình 34kg chất A
khô, với độ lệch chuẩn 0,75.
Thay đổi một chi tiết của quy trình và thử 10 lần, ta được trung bình 34,35kg chất A
khô.
a. Chi tiết được thay đổi có làm thay đổi trọng lượng chất A được sản xuất không?
b. Chi tiết này có làm tăng trọng lượng chất A không? [V2, tr.98]
hợp này:
Về vấn đề cỡ mẫu trong bài toán ước lượng khoảng tin cậy cho trung bình để
≥
n
sai số ước lượng không vượt quá ε cho trước, V1 chứng minh và đưa ra công thức
2 2 C s 2 ε
n ≥
30
2sσ = 2
tìm cỡ mẫu tối thiểu là và trong trường hợp chưa biết phương sai thì khảo
sát một mẫu đủ lớn ( ) và lấy .
Đối với vấn đề tìm cỡ mẫu cho ước lượng tỷ lệ p, cũng giống như phần ước
f
f
)
= ±
p
f C
lượng khoảng tin cậy cho trung bình, V1 đưa ra công thức tìm khoảng tin cậy cho tỷ
− (1 n
lệ là
Đối với việc tìm cỡ mẫu trong bài toán ước lượng khoảng tin cậy cho tỷ lệ để
−
2 C f
f
)
≥
n
sai số ước lượng không vượt quá εcho trước, V1 chứng minh và đưa ra công thức
(1 2 ε
2
≥
n
tìm cỡ mẫu tối thiểu trong trường hợp đã có mẫu thăm dò là . Trong
C 24 ε
với trường hợp chưa có mẫu thăm dò thì công thức tìm cỡ mẫu tối thiểu là
γ 2
⇒ giá trị C theo PPC. Φ(C) =
4.2.3. PPC trong KĐ giả thuyết TK nói chung
KĐ giả thuyết TK là một phần kiến thức quan trọng trong chương trình XS-
TK của IV, được V1 trình bày trong Chương VIII.
Mở đầu, V1 đưa ra một ví dụ 4.1 để dẫn đến nhu cầu của KĐ giả thuyết TK
trong y học.
120
Tỷ lệ bệnh A trong một dân số là 20%. Một chương trình điều trị bệnh A được tiến
hành. Sau một thời gian nhất định, người ta chọn ngẫu nhiên 100 người trong dân số
và khám thấy có 12 người bị bệnh A. Vấn đề đặt ra là sau khi thực hiện chương trình
điều trị bệnh A, tỷ lệ bệnh A trong dân số có thực sự khác 20% không ? [V1, tr.137]
Ví dụ 4.1
Theo ví dụ 4.1, yêu cầu ở đây chỉ là so sánh xem có sự khác biệt hay không về
tỷ lệ bệnh sau khi thực hiện một chương trình điều trị bệnh A. Câu hỏi trong ví dụ
4.1 không yêu cầu đánh giá xem chương trình điều trị bệnh A có hiệu quả hay
không, tức là có làm giảm tỷ lệ bệnh này hay không.
Trong phần tiếp theo, V1 đưa ra định nghĩa về giả thuyết TK, mục đích và ý
Một giả thuyết thống kê có thể định nghĩa là một mệnh đề liên quan đến một đặc tính
hay nhiều đặc tính trong một dân số. Bằng những biện pháp kiểm định, ta có thể kết
luận giả thuyết thống kê đưa ra có phù hợp với thực tiễn hay không, tức là tương thích
với các dữ kiện quan sát hay không. Mục đích của kiểm định giả thuyết thống kê là
giúp ta đi đến những kết luận liên quan đến một hay nhiều đặc tính trong dân số từ
việc khảo sát trên một mẫu được lấy ngẫu nhiên từ dân số đó. [V1, tr.137]
nghĩa của việc KĐ giả thuyết TK:
Các loại giả thuyết TK được giới thiệu trong V1 bao gồm H0 (giả thuyết
không) -“không có sự khác biệt” và HA (đối thuyết hay giả thuyết đối của H0) - giả
thuyết đối lập với H0, dùng để thay thế nếu giả thuyết H0 bị bác bỏ. Giả thuyết HA
không được V1 khẳng định là giả thuyết một đuôi hay hai đuôi nhưng cách trình
bày của V1 cho thấy đây chính là giả thuyết hai đuôi trong KĐ giả thuyết TK:
“Trong ví dụ trên, giả thuyết H0 là “p’ = p” và giả thuyết HA là “p’ ≠ p””.
Khi không đủ cơ sở để bác bỏ giả thuyết H0, V1 gọi là “chấp nhận H0”. Việc
chấp nhận hay bác bỏ H0 có thể phạm phải sai lầm do giả thuyết H0 liên quan đến
toàn bộ dân số nhưng việc KĐ giả thuyết này chỉ dựa vào một mẫu khảo sát. Theo
V1 thì khi KĐ giả thuyết TK có hai khả năng xảy ra: “1- H0 đúng (thực sự p’ = p)
nhưng ta bác bỏ H0, chấp nhận HA ; 2 - H0 sai (trong thực tế p’ ≠ p) nhưng ta chấp
nhận H0”
121
V1 phân tích về hai loại sai lầm trong KĐ giả thuyết TK và gọi tên là sai lầm
loại I và sai lầm loại II tương ứng với hai khả năng nói trên đồng thời khẳng định
Hai sai lầm này có tính đối kháng, tức là muốn hạn chế khả năng sai lầm loại I thì lại
tăng khả năng sai lầm loại II và ngược lại. Nếu tăng kích thước mẫu lên thì sẽ hạn chế
được khả năng sai lầm của hai loại nhưng đồng thời cũng làm tăng chi phí và sự khó
khăn. [V1, tr.138]
rằng:
V1 không khẳng định trong hai loại sai lầm nói trên thì sai lầm nào “nghiêm
trọng hơn” mà thông qua việc trình bày mức ý nghĩa dựa vào “nguyên lý biến cố có
Quy tắc kiểm định giả thuyết được đặt ra sao cho xác suất sai lầm loại I không vượt
quá một số α nhỏ không đáng kể nào đó. P(sai lầm loại I) = P (bác bỏ H0/ H0 đúng) ≤
α. Khi đó α được gọi là mức ý nghĩa hoặc ngưỡng sai lầm. Trên cơ sở mức ý nghĩa α,
ta hạn chế sai lầm loại II. [V1, tr.138]
xác suất nhỏ”, V1 “khuyên” nên hạn chế sai lầm loại II:
Cuối cùng của phần mở đầu chương KĐ giả thuyết TK, V1 trình bày quy tắc
Để kiểm định H0 lấy ngẫu nhiên một mẫu. Căn cứ vào mẫu quan sát đó, ta xây dựng
thống kê T(x1, x2,…, xn).
Giả sử khi H0 đúng, ta biết được luật phân phối của thống kê T(x1, x2,…, xn) (như tuân theo phân phối chuẩn, Student, Fisher, χ2
E…).
Khi đó ta biết được tα sao cho P(|T(x1, x2,…, xn)| > tα / H0 đúng) = α.
Nếu |T(x1, x2,…, xn)| > tα thì bác bỏ giả thuyết H0 vì theo nguyên lý biến cố có xác
suất nhỏ thì biến cố “|T(x1, x2,…, xn)| > tα / H0 đúng” không xảy ra trong lần thử đầu
tiên.
Nếu |T(x1, x2,…, xn)| ≤ tα thì ta không có cơ sở để bác bỏ giả thuyết H0 nên ta chấp
nhận H0. [V1, tr.139]
KĐ. Quy tắc này được hình thành dựa vào nguyên lý biến cố có XS nhỏ:
Trên đây chúng tôi đã phân tích sự tồn tại của khái niệm PPC trong bài toán
KĐ TK nói chung. Với mục đích làm rõ hơn các đặc trưng của quan hệ thể chế
R(IV, O), chúng tôi sẽ xem xét sự hiện diện của khái niệm này trong các phép KĐ
cụ thể. Về các phép kiểm này, V1 đưa vào 4 loại:
- Phép kiểm u dùng để KĐ giả thuyết so sánh hai tỷ lệ, hai trung bình khi đã
biết phương sai;
122
2χ dùng để KĐ giả thuyết so sánh nhiều tỷ lệ
- Phép kiểm chi bình phương
2χ ) ;
(vấn đề so sánh hai tỷ lệ là một trường hợp riêng, và do đó cũng có thể sử
dụng
- Phép kiểm t dùng để KĐ giả thuyết so sánh hai trung bình khi chưa biết
phương sai và cỡ mẫu n < 30;
- Phép kiểm Fisher F dùng để KĐ giả thuyết so sánh hai phương sai.
Do khuôn khổ có hạn của luận án, chúng tôi chỉ tập trung phân tích tác động
của PPC trong các phép kiểm u và t.
4.2.4. PPC trong bài toán KĐ giả thuyết TK về hai tỷ lệ
Phép kiểm u dùng để so sánh hai tỷ lệ trong các trường hợp: so sánh hai tỷ lệ
thực nghiệm và lý thuyết, so sánh hai tỷ lệ thực nghiệm độc lập, so sánh hai tỷ lệ
khi số liệu ghép cặp.
Trong dân số D, tỷ lệ có đặc tính X là p. Sau khi thực hiện những giải pháp nhằm thay
đổi tỷ lệ có đặc tính X trong dân số D, người ta muốn khảo sát sự khác nhau có ý nghĩa
thống kê giữa p và p’. Lấy một mẫu cỡ n từ dân số đó, gọi f là tỷ lệ có đặc tính X
trong mẫu.
4.2.4.1. So sánh tỷ lệ thực nghiệm và tỷ lệ lý thuyết
Thực hiện phép kiểm u
- Đặt giả thuyết H0: p’ = p; HA: p’ ≠ p
=
Nếu H0 đúng thì
u
N
~
(0,1)
f p
)
− p − p (1 n
- Nếu
u ≤
1,96
(hoặc 2,58) thì chấp nhận H0.
α=
- Nếu
(hoặc 0,01)
u >
1,96
(hoặc 2,58) thì bác bỏ H0, chấp nhận HA,
0, 05
≥
−
≥ . [V1, tr.140]
Điều kiện: 0,1
0,9;
) 5
< < p
np
5; (1 n
p
Trích dẫn trên cho thấy V1 đã trình bày tường minh kỹ thuật giải quyết kiểu
tlτ để chỉ kỹ thuật này. Ký hiệu u ở đây chỉ phép kiểm được sử dụng là u, chữ cái
u 2 1
nhiệm vụ Ttl1 so sánh tỷ kệ thực nghiệm và tỷ lệ lý thuyết. Chúng tôi dùng ký hiệu
tl1 (tl là viết tắt của “tỷ lệ”) gắn với kiểu nhiệm vụ Ttl1, còn số 2 để nói rằng đây là
123
α=
0, 05
phép kiểm hai đuôi. Xét về yếu tố công nghệ, chúng tôi thấy V1 không giải thích ở
đây về hai hằng số 1,96 và 2,58 ứng với hoặc 0,01. Nhưng thực ra thì điều
đó đã được trình bày trong phần ước lượng khoảng tin cậy cho trung bình và cho tỷ
(
,...,
~ (1,
)
X độc lập và
B p nên khi xấp xỉ phân phối nhị thức thành PPC
X X , 1
2
)n
iX
≥
−
< < p
0,9;
np
n 5; (1
p
lệ do biến ngẫu nhiên u ~ N(0; 1). Theo định lý giới hạn trung tâm, do
≥ . (Đặng Hùng ) 5
thì cỡ mẫu n phải lớn và thỏa điều kiện 0,1
Thắng, 2010)
Tuy nhiên, V1 đã không giải thích về điều kiện này do trước đó không trình
bày định lý giới hạn trung tâm cho mô hình nhị thức.
Để minh họa phép kiểm u cho kiểu nhiệm vụ Ttl1, V1 đưa ra ví dụ sau:
Trong một dây chuyền sản xuất thuốc có 20% viên không đạt tiêu chuẩn. Một cải tiến
được thực hiện và sản xuất thử 100 viên thấy có 12 viên không đạt chuẩn.
Cải tiến trên có thực sự thay đổi tỷ lệ không đạt chuẩn trong dây chuyền sản suất
không?
Ví dụ 4.2
Giải:
Ta có f = 0,12; p = 0,2, n = 100
Đặt giả thuyết H0: p’ = p; HA: p’ ≠ p
=
=
u
2
f p
)
− p − p (1 n
Do |u| > 1,96 nên bác bỏ H0, chấp nhận HA, α = 0,05.
Kết luận: Sự cải tiến trên làm thay đổi tỷ lệ viên không đạt chuẩn α = 0,05.
[V1, tr.141]
Một vấn đề đáng chú ý là câu hỏi của bài toán trong ví dụ 4.2 là “cải tiến có
làm thay đổi tỷ lệ viên không đạt chuẩn không ?” nên đặt giả thuyết hai đuôi như
trên là phù hợp. Nếu câu hỏi là “Cải tiến trên có làm giảm tỷ lệ viên không đạt
chuẩn hay không ?” thì giả thuyết một đuôi là phù hợp. Để trả lời câu hỏi này, V1
Đặt giả thuyết H0: p’ = p; HA: p’ < p
giới thiệu về phép kiểm u một đuôi.
124
=
Nếu H0 đúng thì
u
~
N
(0;1)
f p
)
− p − (1 p n
- Nếu
(hay
) thì chấp nhận H0.
u ≥ −
1, 64
u ≥ −
2,33
- Nếu u < -1,64 (hay u < - 2,33) thì bác bỏ H0, chấp nhận HA, α= 0,05 (hoặc 0,01)
[V1, tr.141]
tlτ ,để giải quyết trường hợp đối thuyết HA là p > p’. Nhưng kỹ thuật thứ hai này
u 1 1
Như vậy, đối với Ttl1, V1 đã đưa vào kỹ thuật thứ hai, chúng tôi ký hiệu là
chỉ xuất hiện duy nhất một lần qua ví dụ trên. Các ví dụ và bài tập về KĐ giả thuyết
TK trong V1 cũng như V2 đều sử dụng phép kiểm hai đuôi, kể cả trong những
trường hợp cần thiết phải sử dụng phép kiểm một đuôi.
4.2.4.2. So sánh hai tỷ lệ thực nghiệm độc lập
Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2
−
f
f 1
2
=
=
với
~
(0;1)
u
N
Nếu H0 đúng thì
p
+ +
n f 1 1 n 1
n f 2 2 n 2
+
−
(1
)
p
p
1 n 1
1 n 2
- Nếu
(hoặc 2,58) thì ta chấp nhận H0
u ≤
1,96
- Nếu
u >
1,96
(hoặc 2,58) thì ta bác bỏ H0, chấp nhận HA, α= 0,05 (hoặc 0,01)
≥
≥ [V1 tr.142]
n p
n p
5
Điều kiện 0,1 < p < 0,9 và 1
25;
u
Để so sánh 2 tỷ lệ thực nghiệm độc lập, V1 giới thiệu phép kiểm u như sau:
tlτ giải quyết kiểu nhiệm vụ
2 2
Trích dẫn trên chính là các bước của kỹ thuật
Ttl2 - so sánh hai tỷ lệ thực nghiệm độc lập. Ta thấy là V1 chỉ trình bày kỹ thuật sử
dụng phép kiểm hai đuôi, không trình bày kỹ thuật sử dụng phép kiểm một đuôi. Ví
dụ 4.3 sau đây minh họa cho bài toán so sánh hai tỷ lệ thực nghiệm độc lập bằng
phép kiểm hai đuôi.
Điều trị bằng phương pháp 1 để trị bệnh A cho 102 bệnh nhân, ta thấy khỏi bệnh 82
người. Điều trị bằng phương pháp 2 để trị bệnh A cho 98 bệnh nhân, ta thấy khỏi bệnh
69 người. So sánh hiệu quả của hai phương pháp.
Ví dụ 4.3
125
=
=
=
=
Giải: Ta có
f
p
;
;
0, 75
f 1
2
+ +
82 102
69 98
n f 1 1 n 1
n f 2 2 n 2
Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2
−
f
f 1
2
=
=
Ta có
1, 64
u
+
−
(1
)
p
p
1 n 1
1 n 2
Do |u| ≤ 1,96 nên chấp nhận H0.
Kết luận: Hiệu quả của hai phương pháp trên khác nhau không có ý nghĩa. [V1, tr.143]
≥
n p
n p
5
≥ hoàn toàn được thỏa
25;
Trong ví dụ 4.3, điều kiện 0,1 < p < 0,9 và 1
mãn nhưng V1 không thực hiện việc kiểm tra này, việc này được trao lại cho SV.
Ví dụ 4.3 yêu cầu so sánh hiệu quả của hai phương pháp 1 và 2. Hiệu quả khỏi
bệnh được thể hiện qua tỷ lệ khỏi bệnh khi điều trị bằng hai phương pháp nên bài
toán đưa về so sánh hai tỷ lệ thực nghiệm độc lập.
≥
n p
5
Mặc dù không được trình bày một cách tường minh nhưng đối với các mẫu
≥ trong bài toán so sánh hai tỷ lệ
n p 1
25;
≥
−
0,9;
< < p
np
5; (1 n
p
không thỏa điều kiện 0,1 < p < 0,9;
≥ trong bài toán so ) 5
thực nghiệm độc lập và điều kiện 0,1
sánh tỷ lệ thực nghiệm và tỷ lệ lý thuyết, V1 cung cấp một phép kiểm khác để thực
hiện việc so sánh hai tỷ lệ thực nghiệm độc lập đó là phép kiểm chi bình phương mà
chúng tôi không đi sâu phân tích.
4.2.4.3. So sánh hai tỷ lệ thực nghiệm có số liệu đôi
u
Đây là kiểu nhiệm vụ thứ ba về so sánh hai tỷ lệ, chúng tôi ký hiệu là Ttl3. Kỹ
tlτ là sử dụng phép kiểm u cũng được V1 trình bày tường minh như sau:
2 3
Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2
=
hoặc
Theo giả thuyết H0, bài toán trở về so sánh tỷ lệ thực nghiệm
f 1
n 1 +
n 1
n 2
với tỷ lệ lý thuyết p = 0,5.
=
f
2
n 2 +
n 1
n 2
0,5
f 1
=
=
Tính
u
n 1 n 1
− n 2 + n 2
− 0,5 + n 1
n 2
thuật
126
- Nếu
u ≤
1,96
(hoặc 2,58) thì chấp nhận H0.
- Nếu
(hoặc 2,58) thì bác bỏ H0, chấp nhận HA, α= 0,05 (hoặc 0,01)
u >
1,96
[V1, tr.143]
n+
n Điều kiện 1
≥ 2 10
n+
u N
(0,1)
Ở đây V1 không nói rõ biến ngẫu nhiên u tuân theo luật PPC, nhưng các con
n 1
≥ 2 10
số 1,96 và 2,58 cho biết ~ . V1 cũng không nói nếu điều kiện
không thỏa mãn thì sử dụng phép kiểm nào. Các ví dụ minh họa cho phép kiểm chi
u
bình phương được V1 trình bày sau đó cho phép giải quyết bài toán này.
tlτ trong bài toán so sánh hai tỷ lệ
2 3
Ví dụ 4.4 sau đây minh họa cho kỹ thuật
thực nghiệm có số liệu đôi.
Hai loại thuốc giảm đau A và B thử trên cùng 100 bệnh nhân, kết quả 45 người đều
thấy giảm đau (GĐ), 35 người đều thấy không giảm đau (KGĐ), 15 người thấy GĐ
đối với thuốc A, và KGĐ đối với thuốc B, 5 người thấy KGĐ đối với thuốc A, GĐ đối
với thuốc B. Hai loại thuốc này có tác dụng giảm đau khác nhau không?
Ví dụ 4.4
Giải: Chỉ cần chú ý kết quả.
Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2
0,5
f 1
=
=
Ta có
= 2,24
u
n 1 n 1
− n 2 + n 2
− 0,5 + n 1
n 2
Do |u| > 1,96 nên bác bỏ H0, chấp nhận HA, α= 0,05.
Kết luận: Hai loại thuốc A và B có tác dụng giảm đau khác nhau có ý nghĩa.
[V1, tr.144]
Khi |u| = 2,24 < 2,58 ta có thể chấp nhận H0. Khi chấp nhận H0, ngưỡng sai lầm β
không biết.
Khi |u| = 2,24 > 1,96 thì bác bỏ H0, α = 0,05. Trong trường hợp này ta nên bác bỏ H0.
Trong trường hợp cần thiết có thể tiến hành thử nghiệm lại với cỡ mẫu lớn hơn.
[V1, tr.144]
Trong phần chú ý sau đây, V1 giải thích tại sao lấy ngưỡng sai lầm α = 0,05:
Như vậy đã có sự khác biệt trong quyết định bác bỏ hay chấp nhận H0 nếu lấy
ngưỡng sai lầm khác nhau. Lý do lấy α = 0,05 để bác bỏ giả thuyết H0 là vì nếu
α = 0,01 sẽ dẫn đến chấp nhận H0, khi đó không biết sai lầm loại II (β). Điều này
127
phù hợp với quy tắc của KĐ giả thuyết TK là bác bỏ H0 vì H0 còn gọi là giả thuyết
vô hiệu, giả thuyết không mong muốn của nhà nghiên cứu.
4.2.5. PPC và bài toán KĐ giả thuyết về hai trung bình
Loại bài toán thứ hai trong chương này được trình bày trong V1 là bài toán so
sánh hai trung bình. Đây cũng là một trong những bài toán thường gặp nhất trong
y học. Để giải quyết bài toán này, V1 trình bày hai phép kiểm: Nếu phương sai dân
2σ đã biết thì thực hiện phép kiểm u; nếu phương sai dân số
2σ chưa biết thì thực
số
hiện phép kiểm t. Các phép kiểm mà V1 trình bày là phép kiểm hai đuôi, không có
bài toán KĐ giả thuyết TK nào trong V1 được thực hiện bằng phép kiểm một đuôi,
dù rằng có bằng chứng cho thấy sử dụng phép kiểm một đuôi sẽ phù hợp hơn.
4.2.5.1. So sánh hai trung bình thực nghiệm và lý thuyết
2σ đã biết.
Chúng tôi gọi đây là kiểu nhiệm vụ Ttb1 (tb là viết tắt của « trung bình »)
• Khi phương sai
Đặt giả thuyết H0: µ’ = µ ; HA: µ’ ≠ µ
−
µ
=
~ N(0;1)
Theo giả thuyết H0, ta có
u
x σ
/
n
- Nếu |u| ≤ 1,96 (hoặc 2,58) thì ta chấp nhận H0
- Nếu |u| > 1,96 (hoặc 2,58) thì ta bác bỏ H0, chấp nhận HA, α = 0,05 (hoặc 0,01)
V1 trình bày phép kiểm u như sau:
Chú ý: Nếu n ≥ 30 thì
2sσ = 2
Một phương pháp chiết suất dược liệu cho trung bình 150g cao/1kg dược liệu và σ =
20g. Một cải tiến được thực hiện. Sau khi chiết suất 30 lần, ta được trung bình 160g
cao/1kg dược liệu. Kết luận ?
Ví dụ 4.5
Giải: Đặt giả thuyết H0: µ’ = µ; HA: µ’ ≠ µ
−
µ
=
= 2,7 . Do |u| > 2,58 nên ta bác bỏ H0, chấp nhận HA, α = 0,01
u
x σ
/
n
Kết luận: Cải tiến trên là một cải tiến thực sự, α = 0,01. [V1, tr.163]
u
tbτ để chỉ kỹ thuật giải quyết kiểu nhiệm vụ Ttb1 mà
2 1
Chúng tôi dùng ký hiệu
V1 đã đưa vào. Kỹ thuật này chính là sử dụng phép kiểm u hai đuôi. Nếu sử dụng
128
phép kiểm u hai đuôi thì khi bác bỏ H0 chỉ có thể kết luận “Sự khác biệt giữa µ’ và
µ có ý nghĩa”. Thế nhưng V1 đã kết luận sự khác biệt đó theo chiều hướng µ’ > µ
để dẫn đến “Cải tiến trên là một cải tiến thực sự” mà không giải thích lý do. Có lẽ
do số liệu nêu trong bài toán mang lại bằng chứng cho thấy thấy sau cải tiến, lượng
dược liệu chiết suất trung bình cao hơn hẳn trước khi cải tiến. Nhưng nếu không có
bằng chứng đó thì sao ? Dường như V1 đã không cung cấp một kỹ thuật đầy đủ để
2σ chưa biết và cỡ mẫu n < 30
giải quyết Ttb1.
Đặt giả thuyết H0: µ’ = µ; HA:µ’ ≠ µ
µ−
=
~ Student (n-1)
Theo giả thuyết H0, ta có
t
n
x s /
- Nếu |t| ≤ tα (n-1) (với α = 0,05 hoặc 0,01) thì ta chấp nhận H0
- Nếu |u| > tα (n-1) (với α = 0,05 hoặc 0,01) thì ta bác bỏ H0, chấp nhận HA, mức ý
nghĩa α.
t
• Khi phương sai
tbτ để chỉ kỹ thuật thứ hai đã được V1 đưa vào để giải
2 1
Chúng tôi dùng ký hiệu
quyết Ttb1. Kỹ thuật này bao hàm việc sử dụng phép kiểm t hai đuôi. Ví dụ sau được
V1 đưa ra để minh họa cho kỹ thuật này.
Điều tra lượng cholesterol toàn phần trong huyết thanh của 25 bệnh nhân bị bệnh X,
ta có X = 176 mg, s = 40 mg. Theo tài liệu µ = 156 (hằng số sinh học của người
bình thường). Kết luận ?
Ví dụ 4.6
Giải: Đặt giả thuyết H0: µ’ = µ; HA: µ’ ≠ µ
µ−
=
Ta có
= 2,5.
t
n
x s /
Do |t| > t0,05 (24) = 2,069 bác bỏ H0, chấp nhận HA, α = 0,05.
Kết luận: Lượng cholesterol trung bình của người bị bệnh X và người bình thường
khác nhau không có ý nghĩa. [V1, tr.167]
Phần lý thuyết và ví dụ trên về trường hợp σ2 chưa biết và n < 30 cho thấy V1
đã sử dụng phép kiểm t mà không nhắc tới các điều kiện của phép kiểm này, đó là
DL phải có PPC. Hơn nữa, khi n < 30 thì sự khác biệt giữa phương sai mẫu và
129
phương sai dân số có thể có ý nghĩa TK, điều này cũng không được V1 kiểm tra
trước khi thực hiện KĐ giả thuyết.
4.2.5.2. So sánh hai trung bình thực nghiệm độc lập
Để đánh giá sự khác biệt về trung bình giữa 2 mẫu, V1 trình bày bài toán so
sánh hai trung bình thực nghiệm độc lập khi σ đã biết và chưa biết. Chúng tôi gọi
2
2
đây là kiểu nhiệm vụ Ttb2.
1σ và
2σ đã biết:
Xét hai mẫu từ hai dân số có phân phối chuẩn
N µ σ và ;
)
(
(
)
;
,x x 1 2
2 1
1
2 N µ σ . Gọi 2
2
lần lượt là số trung bình của 2 mẫu đó.
Đặt giả thuyết H0: µ1 = µ2 và HA: µ1 ≠ µ2.
−
x 1
=
Theo H0, ta có
u
~
N
(0,1)
x 2 2 2 σ σ + 2 1 n n 2 1
- Nếu |u| ≤ 1,96 (hoặc 2,58) thì chấp nhận H0
- Nếu |u| > 1,96 (hoặc 2,58) thì bác bỏ H0, chấp nhận HA, α = 0,05 (hoặc 0,01)
• Khi
Chú ý: n1 ≥ 30, n2 ≥ 30 thì có thể xem như σ1 ≅ s1, σ2 ≅ s2 [V1, tr.163-164]
−
=
=
2 σ σ + 2
2
x 1
x
~
N
;
)
Trong phần này, V1 giải thích phân phối của hiệu hai trung bình có PPC
2 − µ µ µ σ ( 1
2
2 1 n 1
n 2
. Điều này cũng đã được giải thích trong
Chương VI - Lý thuyết mẫu. Ở đó, V1 có trình bày nhưng không chứng minh định lý
giới hạn trung tâm với chú ý rằng: “Định lý này rất quan trọng đối với người làm
TK, với mẫu lớn thì X gần như có phân phối bình thường, bất chấp đặc tính X trong
dân số có phân phối gì”. (V1, tr.99)
u
Như vậy, theo V1, nếu mẫu lớn thì đặc tính X gần như có PPC mà không cần
tbτ , nó bao hàm việc sử
2 2
KĐ tính chuẩn của DL. Chúng tôi gọi kỹ thuật trên là
2
2
dụng phép kiểm u hai đuôi.
2σ , cỡ mẫu nhỏ hơn 30
1σ và
• Khi chưa biết
130
Xét hai mẫu từ hai dân số có phân phối chuẩn
N µ σ và ;
(
)
(
)
;
,x x 1 2
2 1
1
2 N µ σ . Gọi 2
2
lần lượt là số trung bình của 2 mẫu đó. Muốn so sánh µ1 và µ2 trước hết ta phải
có 2 1
2 σ σ= 2
Đặt giả thuyết H0: µ1= µ2 và HA: µ1 ≠ µ2
−
+
−
(
(
1)
n 1
2 s 2
=
=
=
Ước lượng
σ σ σ 1 2
2 s 1 +
n 2 − 2
1) n 1
n 2
−
x 2
=
+
−
Theo giả thuyết H0, ta có
~
(
2)
t
Student n 1
n 2
σ
+
x 1 1 n 1
1 n 2
+
−
- Nếu |t| ≤
thì chấp nhận H0
2)
t n ( α 1
n 2
+
−
- Nếu |t| >
thì ta bác bỏ H0, chấp nhận HA, α = 0,05 (hoặc 0,01)
2)
t n ( α 1
n 2
Chú ý: Khi so sánh hai số trung bình µ1 và µ2 của hai dân số có phân phối
2
2
chuẩn,
E ta có thể thực hiện phép
N µ σ dù chưa biết giá trị của σ2
)
;
)
N µ σ và ;
2(
1(
kiểm t như trên, không cần để ý đến n < 30 hay n ≥ 30 [V1, tr.168-169]
Chú ý mà V1 đưa ra không rõ ràng vì phần lý thuyết đang nói đến trường hợp
E và n < 30, hơn nữa V1 chỉ nói n mà không nói rõ n1 < 30 hay n2 < 30
chưa biết σ2
hoặc cả hai mẫu đều có cỡ mẫu đều nhỏ hơn 30.
2 t tbτ . 2
Kỹ thuật này là sử dụng phép kiểm t hai đuôi nên chúng tôi ký hiệu là
Trong phần lý thuyết trên, V1 có nhắc đến điều kiện của phép kiểm t: DL được lấy
2 σ σ= 2
2 1
từ hai dân số có PPC và phương sai đồng nhất , nhưng không có bước nào
thực hiện kiểm tra hai điều kiện này.
Trong ví dụ 4.7 dưới đây, V1 không thực hiện kiểm tra hai điều kiện của phép
kiểm t mà ngầm ẩn rằng hai điều kiện đó đã được thỏa mãn.
Muốn so sánh hai loại thuốc bổ A và B, người ta cho hai nhóm người thử.
Kết quả:
Nhóm uống thuốc A: 5, 4, 2, 1, 4
Nhóm uống thuốc B: 6, 5, 4, 2, 6, 4, 5
Kết luận ?
Ví dụ 4.7
131
Giải: Đặt giả thuyết H0: µ1= µ2 và HA: µ1 ≠ µ2
−
+
−
(
(
1)
n 1
2 s 2
=
=
Tính
=
σ σ σ 1 2
2 s 1 +
n 2 − 2
1) n 1
n 2
A x A
1 A-A x A
2A
E Suy ra t =E
= 1,562
σ
1 nA 1A
1 A A+A A nA 2A
Do |t| < tR0,05R (10) = 2,228 nên chấp nhận HR0R. Kết luận: Hai loại thuốc bổ A và B khác nhau có ý nghĩa. [V1, tr.168-169]
A A E E E E E E
Có lẽ việc KĐ tính chuẩn của DL có thể là khó đối với SV vì trước đó V1
chưa trình bày phương pháp KĐ tính chuẩn của DL khi nó ở dạng “thô”.
Ngoài ra, V1 cũng không thực hiện KĐ tính đồng nhất của hai phương sai và
Chú ý: Trước khi thực hiện bài toán so sánh hai số trung bình µR1R và µR2R khi σ chưa
2
2
biết và cỡ mẫu n < 30, ta phải so sánh hai phương sai
1σ và
2σ . Nếu hai phương sai
2
2
1σ và
2σ khác nhau không có ý nghĩa thì ta thực hiện so sánh hai số trung bình µR1R và
µR2R. [V1, tr.169]
2
2
tính phương sai nhập, công việc này được trao lại cho SV bởi chú ý sau:
1σ =
2σ
Chú ý trên chỉ yêu cầu kiểm tra điều kiện hai phương sai đồng nhất
nhưng phương pháp KĐ điều này thì V1 không nhắc đến. Hơn nữa nếu khi so sánh
hai phương sai dẫn đến phương sai không đồng nhất thì V1 cũng không đưa ra
phương án để giải quyết vấn đề này.
Như vậy, ứng với hai trường hợp của TRtb2R, V1 đã đưa vào hai kỹ thuật. Chúng
2 u tbτ , 2
2 t tbτ . 2
tôi gọi hai kỹ thuật, đó là
4.2.5.3. So sánh hai trung bình thực nghiệm khi có số liệu đôi (ghép cặp)
Đây là kiểu nhiệm vụ T Rtb3R liên quan đến vấn đề KĐ giả thuyết về trung bình.
Xét hai dãy số liệu đôi xR1iR và xR2iR với i = 1, …, n
x i
d
Tính xRdR = xR1iR – xR2iR và
x
= ∑ n
Đặt giả thuyết HR0R: µR1R= µR2R và HRAR: µR1 R≠ µR2R.
• Khi phương sai đã biết
132
=
Ta có
~
(0;1)
u
N
x d nσ /
d
- Nếu |u| ≤ 1,96 (hoặc 2,58) thì ta chấp nhận HR0
- Nếu |u| > 1,96 (hoặc 2,58) thì ta bác bỏ HR0R, chấp nhận HRAR, α = 0,05 (hoặc 0,01)
2
−
d
(
)
x
∑
=
với
[V1, tr.165]
2 s d
Chú ý: n ≥ 30 thì ta có thể xem như d
s σ= d
−
x i n
1
=
−
dx và
2s chỉ thực hiện trên dãy DL
Như vậy, khi σ đã biết thì u ~ N(0;1) với mọi giá trị của cỡ mẫu n và việc tính
x d
x 1 i
x 2
i
, không quan tâm toán các giá trị
dx . Chúng tôi gọi đây là kỹ thuật
u 2 tbτ 3
đến phân phối của DL ban đầu và dãy DL
• Khi phương sai chưa biết và cỡ mẫu n < 30
Phần này tương tự bài toán so sánh hai trung bình thực nghiệm, số liệu đôi khi
d
=
t
σ đã biết nhưng thay vì thực hiện phép kiểm u thì thực hiện phép kiểm t với
x /
n
s d
=
−
~ Student(n-1)
x d
x 1 i
x 2
i
có PPC. Tuy Để thực hiện phép kiểm t, điều kiện cần thiết là DL
nhiên, trong ví dụ 4.8, V1 cũng không thực hiện kiểm tra điều kiện chuẩn của xd.
Hơn nữa, trong ví dụ 4.8, có thể thực hiện phép kiểm t một đuôi vì có bằng chứng
cho thấy có sự khác biệt đáng kể về trung bình trước và sau thực nghiệm.
6 con chuột được cho uống thuốc A để thử độ tăng lực. Chuột được cho leo cây cho
đến khi kiệt sức, thời gian tính bằng phút. Kết quả:
Kết luận ?
Ví dụ 4.8
Giải: Đặt giả thuyết H0: µ1 = µ2 và HA: µ1 ≠ µ2.
d
=
= 3,962
t
x /
n
s d
Do |t| > t0,05 (5) = 2,57 nên bác bỏ H0, chấp nhận HA, α = 0,05
Kết luận: Thuốc A có ảnh hưởng đến độ tăng lực. [V1, tr.171]
133
Kết luận mà V1 đưa ra phù hợp với giả thuyết hai đuôi đã đặt ra nhưng chưa
kết luận được thuốc A có tác dụng tăng lực không vì thực nghiệm muốn chứng tỏ
độ tăng lực của thuốc A trên chuột. Trong trường hợp cần chứng tỏ thuốc A có tác
dụng tăng lực thì phép kiểm t một đuôi là cần thiết. Tuy nhiên, V1 không trình bày
phép kiểm t một đuôi đối với trường hợp so sánh hai trung bình thực nghiệm khi có
số liệu ghép cặp.
Ta thấy rằng đối với Ttb3 cũng đã có hai kỹ thuật được đưa vào trong V1.
u 2 tbτ , 3
2 t tbτ . 3
Chúng tôi gọi đó là
4.2.6. Những tổ chức toán học liên quan đến KĐ giả thuyết TK
Sau khi phân tích V1, chúng tôi đã xem xét toàn bộ hệ thống bài tập về KĐ giả
thuyết TK hiện diện trong V2. Chúng tôi thấy V2 không đưa thêm vào kiểu nhiệm
vụ nào, cũng không đề xuất một kỹ thuật nào mới. Như vậy, trong Iv, bài toán KĐ
giả thuyết TK về trung bình và tỷ lệ liên quan đến 6 kiểu nhiệm vụ nêu trong
Bảng 4.3.
Bảng 4.3. Các kiểu nhiệm vụ và kỹ thuật liên quan đến phép kiểm u và t
134
Kỹ thuật giải quyết những kiểu nhiệm vụ này đã được V1 trình bày rõ ràng và
chúng tôi cũng đã trích dẫn đầy đủ ở trên. Vì thế, trong Bảng 4.3 chúng tôi chỉ tổng
hợp nét đặc trưng cho mỗi kỹ thuật: dùng phép kiểm u hay t, một đuôi hay hai đuôi.
Yếu tố công nghệ giải thích cho các kỹ thuật gồm hai loại. Thứ nhất, đó chính
là các kiến thức lý thuyết chứng minh cho công thức tính u, t được nêu trong mỗi kỹ
thuật. Thứ hai, đó nguyên tắc KĐ: việc chấp nhận H0 phụ thuộc vào khoảng ước
lượng với độ tin cậy chọn trước.
4.2.7. Nhận xét về phần KĐ giả thuyết TK trong V1 và V2
Việc phân tích V2 đã củng cố thêm những nhận xét mà chúng tôi đã rút ra khi
nghiên cứu V1.
- Đối với bài toán so sánh hai tỷ lệ, kỹ thuật là sử dụng phép kiểm u. Đối với
bài toán so sánh hai trung bình thì có thể sử dụng phép kiểm u nếu đã biết phương
sai, sử dụng phép kiểm t nếu chưa biết phương sai và kích thước mẫu nhỏ hơn 30.
- Phép kiểm được trình bày trong V1 và V2 nói chung là phép kiểm hai đuôi.
Cụ thể, đối với tất cả các bài toán KĐ giả thuyết TK, V1 và V2 đều không đưa vào
tlτ để giải quyết kiểu nhiệm vụ
u 1 1
phép kiểm một đuôi, trừ khi đề cập đến kỹ thuật
Ttl1 - so sánh tỷ lệ thực nghiệm và tỷ lệ lý thuyết. Nhưng kỹ thuật này chỉ xuất hiện
một lần duy nhất trong V1 và hoàn toàn không được gặp lại trong V2.
- Giả thuyết TK mà V1 đặt ra trong các bài toán KĐ giả thuyết TK là: H0 - “Sự
khác biệt không có ý nghĩa”, còn đối thuyết HA luôn phát hiểu ở dạng “Sự khác biệt
có ý nghĩa”. Điều này xuất phát từ chủ trương ưu tiên cho phép kiểm hai đuôi như
nhận xét trên. Thực ra, trong một số bài toán có mặt trong V1 và V2, việc phát biểu
đối thuyết HA ở dạng p < p’ (hay p > p’), µ < µ’ (hay µ > µ’) là hợp lý. Nhưng các
đối thuyết dạng này không được xem xét, vì kỹ thuật sử dụng phép kiểm một đuôi
không được đưa vào. Trong ví dụ 4.8 nêu trên, khi H0 bị bác bỏ thì V1 đưa ra kết
luận µ > µ’ mà không giải thích vì sao.
t
- Điều kiện thực hiện phép kiểm t là DL có PPC (và phương sai đồng nhất).
t 2 tbτ , 2
2 t tbτ , 1
2 3
tbτ dùng trong bài toán so sánh hai trung
Thế nhưng, trong các kỹ thuật
135
bình thì việc kiểm tra điều kiện PPC không được nói đến. Phần lời giải các ví dụ và
bài tập trong V1, V2, việc kiểm tra này cũng không được thực hiện (vấn đề KĐ tính
chuẩn của DL là một bài toán độc lập, được nêu trong phần ứng dụng của phép
kiểm chi bình phương). DL cho trong tất cả các ví dụ của V1 và bài tập của V2 đều
đã có PPC nên việc SV có chú ý đến điều kiện DL có PPC trong phép kiểm t hay
không cũng không gây ra sai lầm nếu các tính toán là đúng. Tuy nhiên, nếu gặp bài
toán thực tế mà ở đó DL không có PPC thì chúng tôi dự đoán là SV sẽ thực hiện
ngay phép kiểm t mà không chú ý đến điều kiện của phép kiểm này. Trong một số
trường hợp, cách làm này sẽ gây nên sai lầm ở SV.
Như vậy, việc KĐ tính chuẩn của DL không phải là trách nhiệm của SV vì nó
không được nhắc đến trong kỹ thuật giải quyết các bài toán KĐ được V1 và V2
xem xét.
Phân tích trên cho phép chúng tôi dự kiến hai kiểu sai lầm của SV:
- Luôn sử dụng phép kiểm hai đuôi để KĐ các giả thuyết về so sánh hai
trung bình.
- Không kiểm tra tính chuẩn của DL khi dùng phép kiểm t.
B. SO SÁNH CÁC QUAN HỆ THỂ CHẾ R(IV, O), R(IF, O), R(IA, O)
Nghiên cứu đối chiếu quan hệ của các thể chế khác nhau đối với đối tượng O
(KĐ giả thuyết TK và PPC) sẽ giúp ta nhìn rõ hơn đặc trưng của thể chế IV, từ đó
thấy được cái gì có thể tồn tại nhưng đã không tồn tại trong IV.
Nghiên cứu so sánh sẽ được thực hiện thông qua việc đối chiếu các giáo trình
dùng cho DH môn XS – TK ở ba thể chế IV, IF, IA. Đối với IF, IA đó là hai giáo
trình ở hai trường Đại học Y mà chúng tôi đã giới thiệu ở đầu chương 4, được ký
hiệu là F đối với giáo trình của Đại học Grenoble (Pháp) và là A đối với giáo trình
của Đại học Nam Illinois (Hoa Kỳ).
4.3. CÁC ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IF, O)
Bảng 4.4 đưa ra một cái nhìn tổng thể về sự giống và khác nhau ở nội dung thể
hiện trong hai giáo trình V1 và F.
136
Bảng 4.4. Phân phối chương trình XS-TK trong V1 và F
Giáo trình Xác suất Thống kê Phương pháp Tổng cộng
5 5 1 Số chương 11 F Số trang (%) 91 (39,2) 119 (51,3) 22 (9,5) 232
1 8 4 Số chương 13 V1 Số trang (%) 34 (9,6) 220 (61,8) 102 (28,6) 356
[Nguồn: Bessot A., 2013]
Dưới đây, chúng tôi sẽ chỉ ra những điểm giống và khác nhau giữa hai giáo trình
V1 và F.
4.3.1. Những điểm giống nhau
4.3.1.1. Về thứ tự và vị trí của các kiến thức
- Thứ tự các lĩnh vực được đưa vào giáo trình hoàn toàn giống nhau: XS - TK
- Phương pháp chuyên biệt cho các tình huống y học.
- TK chiếm vị trí quan trọng hơn XS trong cả hai giáo trình: Ở F là 51,3% và
V1 là 61,8%.
4.3.1.2. Về phần XS cơ bản
- Khái niệm về biến cố (sự kiện) và quan hệ giữa các biến cố: Phép hội, phép giao,
phép hiệu, phép bù; các khái niệm về biến cố độc lập, phụ thuộc, xung khắc được
trình bày đầy đủ trong cả hai giáo trình.
- Hai giáo trình đều trình bày định nghĩa XS theo cổ điển mà không yêu cầu kiểm
tra tính đồng khả năng của các biến cố. Đặc biệt, V1 và F không trình bày định
nghĩa XS theo tần suất nhưng F trình bày thêm định nghĩa XS theo độ đo.
- Các công thức tính XS: Cộng, nhân, XS có điều kiện, XS toàn phần, Bayes.
- Các khái niệm về biến ngẫu nhiên, hàm mật độ XS và phân phối XS của các biến
ngẫu nhiên rời rạc và liên tục, trung bình và phương sai của biến ngẫu nhiên.
- Các phân phối XS được đưa vào hai giáo trình: Nhị thức, Poisson, chuẩn.
137
4.3.1.3. Về các ứng dụng ứng dụng của XS trong chẩn đoán
- Những ứng dụng này được trình bày thành một chương riêng biệt: ở V1 là Chương
11 - Xác suất trong chẩn đoán, còn ở F là Chương 2 - Độ nhạy, độ chuyên và giá trị
tiên đoán
- V1 và F đều trình bày các khái niệm về độ nhạy, độ chuyên và giá trị tiên đoán
như là các XS có điều kiện được sử dụng trong chẩn đoán.
- Mặc dù V1 và F sử dụng các ký hiệu khác nhau nhưng đều trình bày 3 phương
pháp xác định giá trị tiên đoán: bảng 2×2, Bayes, tỷ cơ hội.
4.3.1.4. Về phần TK
- Mức độ quan trọng của KĐ giả thuyết TK trong cả hai giáo trình là tương đương
nhau: Trong V1 gồm 57/232 trang, chiếm tỷ lệ 24,6 % còn trong F gồm 101/356
trang, chiếm tỷ lệ 28,4%.
- Các sai lầm trong KĐ giả thuyết TK, phân biệt sai lầm loại 1 (α) và sai lầm loại 2
(β), quy tắc đặt giả thuyết TK, quy tắc quyết định bác bỏ/ không bác bỏ (chấp nhận)
giả thuyết H0 được trình bày rõ ràng và có hình ảnh minh họa.
- Việc KĐ giả thuyết TK trong hai giáo trình cũng đồng nghĩa với kiểu nhiệm vụ so
sánh: So sánh hai trung bình, so sánh hai phương sai, so sánh hai tỷ lệ, so sánh
nhiều trung bình (phân tích phương sai), so sánh nhiều tỷ lệ (phép kiểm chi bình
(Chi bình
phương), so sánh nhiều phương sai (phép kiểm Bartlett và Cochran). - Các phép KĐ giả thuyết TK: u (Chuẩn), t (Student), F (Fisher), χ2
phương), Bartlett, Cochran, Duncan đều được trình bày và minh họa bằng nhiều ví
dụ trong V1 và F.
- Khi sử dụng biến ngẫu nhiên t có phân phối Student trong ước lượng khoảng tin
cậy và KĐ giả thuyết TK, V1 và F đều nhắc đến các điều kiện về tính chuẩn của DL
và phương sai đồng nhất nhưng không yêu cầu kiểm tra các điều kiện này.
4.3.2. Những điểm khác nhau
4.3.2.1. Về phần XS
- XS có vị trí quan trọng hơn trong V1 so với F: Ở V1 có 5 chương, 91 trang, chiếm
tỷ lệ 39,2% trong khi ở F có 1 chương, 34 trang, chiếm tỷ lệ 9,6%
138
- Các phương pháp chuyên biệt cho các tình huống y học ở F có vai trò quan trọng
hơn so với V1, điều này thể hiện ở chỗ: Trong V1 chỉ có một chương với tên gọi là
“Xác suất trong chẩn đoán” trong khi trong F có 4 chương là “Nguyên lý phương
pháp luận về thử nghiệm lâm sàng” (Chương 10), “TK cho dịch tễ học” (chương
11), “Phân tích sống sót” (chương 12) và “Phân tích quyết định lâm sàng”
(chương 13)
Sự khác biệt về phần XS giữa hai giáo trình đã dẫn đến sự xuất hiện các tổ
chức toán học hỗn hợp khác nhau. Tổ chức toán học hỗn hợp ở đây là sự kết nối
giữa các đối tượng toán học và đối tượng ngoài toán học chính là các kiến thức
y học.
Chẳng hạn trong V1, tồn tại tổ chức toán học hỗn hợp về sự kết nối giữa đối
tượng toán học là công thức Bayes và phương pháp ra quyết định lâm sàng dựa trên
mô hình ngưỡng. Mô hình này cho phép bác sĩ đưa ra quyết định có cho đối tượng
nghi ngờ có bệnh B làm XN T hay không hoặc có cho điều trị hay không. Quyết
định này tùy thuộc vào XS bệnh rơi vào vùng nào trong ba vùng: Vùng theo dõi,
vùng XN và vùng điều trị của mô hình ngưỡng. Để tính XS bệnh thì bác sĩ cần phải
dùng đến các đối tượng toán học như: XS tiền nghiệm, XS hậu nghiệm, công thức
XS có điều kiện, công thức Bayes,…
Còn trong F tồn tại tổ chức toán học hỗn hợp với tên gọi “Phân tích sống sót”.
Đây là thủ tục dùng để so sánh hai phương pháp điều trị cho các bệnh có tỷ lệ tử
vong cao như ung thư, tim mạch, AIDS,… mà các phương pháp điều trị này được
đánh giá trong các mô hình có biến phụ thuộc là biến nhị phân nhưng không quan
tâm đến yếu tố thời gian. Trong các mô hình này, mặc dù đã đánh giá sự khác biệt
về tỷ lệ tử vong hoặc tỷ lệ khỏi bệnh giữa hai phương pháp điều trị là giống nhau
nhưng thời gian tử vong hoặc khỏi bệnh của hai nhóm có thể khác nhau. Phương
pháp phân tích sống sót cho phép tìm ra sự khác biệt giữa hai nhóm điều trị, xử lý
được các trường hợp đối tượng nghiên cứu bỏ cuộc trong thời gian nghiên cứu. Đối
tượng toán học trong phân tích sống sót là ước tính Kaplan-Meier [F, tr.333-349],
139
tức là tính XS sống sót tích lũy tại các thời điểm khác nhau và sử dụng phép kiểm
logrank [F, tr.349-352] để so sánh hai hàm XS tích lũy của hai nhóm điều trị.
4.3.2.1. Về phần TK
a. Đặt giả thuyết TK
- Trong V1: Giả thuyết H0: Sự khác biệt giữa hai đại lượng cần so sánh không có ý
nghĩa TK, giả thuyết HA đối lập với H0 nên V1 gọi HA là giả thuyết đối. V1 chỉ
trình bày phép kiểm hai đuôi, không trình bày lý thuyết phép kiểm một đuôi trong
các bài toán KĐ giả thuyết TK về so sánh hai trung bình.
- Trong F: Luôn đặt giả thuyết H0 là “Hai đại lượng cần so sánh bằng nhau”. F gọi
giả thuyết thay thế là H1 với 3 trường hợp ≠, <, >.
Ví dụ 4.9 sau đây minh họa về giả thuyết hai đuôi trong F.
Trong 50 người ở vùng Basques có 35 người có kết quả XN nhóm máu có Rh dương
tính. Có thể kết luận rằng 85% dân số Pháp có Rh dương tính không?
Đặt giả thuyết:
Ví dụ 4.9
Gọi p là tỷ lệ thực tế trong khảo sát 50 người p =
= 0,7
35 50
nπ = 43,5 > 5 và n(1-π) = 7,5 > 5
−
=
~ N(0, 1)
z
p 0,85 × 0,85 0,15 50
=
= 2,97
z
− | 0, 7 0,85 | × 0,85 0,15 50
Tra bảng phân phối chuẩn với α = 0,05 thì 2,97 > 1,96 nên H0 bị bác bỏ
Tỷ lệ những người trong máu có Rh+ nhỏ hơn 0,85 với p giá trị < 0,005
[F, tr.193-194]
H0: π = 0,85; H1: π ≠ 0,85
Thật dễ dàng vô hiệu hóa một giả thuyết (một phản ví dụ là đủ) trong khi việc xác
nhận một giả thuyết đòi hỏi phải tìm ra tất cả những tình huống có thể và không một
tình huống nào trong số đó mâu thuẫn với giả thuyết đang xét. [F, tr.148]
Vì H0 là giả thuyết vô hiệu nên cần phải tìm cách bác bỏ:
140
H1 là giả thuyết thay thế khi bác bỏ H0: “Việc bác bỏ H0 tạo thuận lợi cho một
giả thuyết khác, gọi là giả thuyết thay thế mà ta sẽ ký hiệu là H1” [F, tr.155]
- Trong V1, nếu từ DL thu được chưa đủ cơ sở để bác bỏ H0 thì V1 kết luận chấp
nhận H0 (sự khác biệt không có ý nghĩa TK).
- Trong F, nếu chưa đủ cơ sở bác bỏ H0 thì kết luận không bác bỏ H0 (không đồng
nghĩa với H0 đúng): “Nếu H0 đáng tin cậy thì không bác bỏ H0, nếu H0 không đáng
tin cậy thì bác bỏ H0” [F, tr.155]
Khác với V1, F còn trình bày lý thuyết và minh họa bằng hình ảnh về phép
kiểm một đuôi và hai đuôi, đồng thời đưa ra một ví dụ (ví dụ 4.10) trong đó có sự
khác biệt về kết luận giữa dùng giả thuyết một đuôi và hai đuôi.
Một nghiên cứu trên 2 nhóm phụ nữ ở độ tuổi sinh đẻ từ 20 đến 25, sinh thường một
bé qua ngả âm đạo. Nhóm 1 gồm 49 phụ nữ bỏ hút thuốc vào đầu thai kỳ, nhóm 2 gồm
49 phụ nữ không hút thuốc. Trọng lượng trung bình của trẻ sơ sinh trong nhóm 1 là 3010 (g) và phương sai là 1702 (g2)và của nhóm 2 là 2950 (g) với phương sai là 1682 (g2)
Hỏi trọng lượng trung bình của trẻ sơ sinh trong hai nhóm khác nhau có ý nghĩa thống
kê không?
Đặt H0: Trọng lượng trung bình trẻ sơ sinh trong hai nhóm khác biệt không có ý nghĩa
thống kê.
Trường hợp 1. Đặt H1: Trọng lượng trung bình trẻ sơ sinh trong hai nhóm khác biệt có
ý nghĩa thống kê.
Trường hợp 2. Đặt H1: Trọng lượng trung bình trẻ sơ sinh trong nhóm mẹ không hút
thuốc cao hơn so với nhóm mẹ hút thuốc.
=
= 1,76
u
− 3010 2950 2 2
+
170 49
168 49
Trường hợp 1: KĐ hai đuôi, |u| < 1,96 nên không bác bỏ H0.
Trường hợp 2: KĐ một đuôi, u > 1,64 nên H0 bị bác bỏ.
Kết luận: Trọng lượng trung bình trẻ sơ sinh trong nhóm mẹ không hút thuốc cao hơn
so với nhóm mẹ hút thuốc [F, tr.206-208]
Ví dụ 4.10
141
Ngoài quy tắc quyết định bác bỏ hay không bác bỏ H0 bằng mức ý nghĩa α
(sai lầm loại 1), F còn trình bày quy tắc quyết định về giả thuyết có ý nghĩa TK hay
không bằng cách sử dụng phương pháp p giá trị (p_value), điều này hoàn toàn vắng
Tra bảng PPC với α = 0,05 thì 2,97 > 1,96 nên H0 bị bác bỏ. Tỷ lệ những người trong
máu có Rh+ nhỏ hơn 0,85 với p < 0,005 [F, tr.193-194]
mặt trong V1.
Về các phép kiểm trong KĐ giả thuyết TK, chúng tôi nhận thấy, V1 trình bày
các phép kiểm theo sơ đồ 4.1 (Bessot A., 2013). Còn trong F, các phép kiểm được
trình bày theo sơ đồ 4.2 (Bessot A., 2013).
Sơ đồ 4.1. Phân bố các phép kiểm trong V1
142
Sơ đồ 4.2. Phân bố các phép kiểm trong F
b. Về các kiểu nhiệm vụ so sánh
Trong hai giáo trình có sự khác biệt về số lượng kiểu nhiệm vụ so sánh:
- Trong V1: Có 3 kiểu nhiệm vụ rút ra từ 18 trường hợp trong sơ đồ trên là: So sánh
các tỷ lệ, so sánh các trung bình, so sánh các phương sai.
- Trong F: Có 2 kiểu nhiệm vụ như sau: So sánh các tỷ lệ, so sánh các trung bình.
Phân tích phương sai là kiểu nhiệm vụ con của kiểu nhiệm vụ so sánh các trung
bình trong hai trường hợp: So sánh hai trung bình thực nghiệm khi cỡ mẫu n1 < 30
hoặc/và n2 < 30, so sánh nhiều hơn hai trung bình.
Khi DL không có PPC, F trình bày các phép kiểm phi tham số để giải quyết
bài toán KĐ giả thuyết TK, trong khi ở V1 thì DL mặc nhiên có PPC nên V1 không
- Kiểm định tham số dựa trên các giả thuyết liên quan đến các phân phối ngầm của các
biến được khảo sát.
- Kiểm định phi tham số (dựa trên các thứ hạng) nếu nó không tạo ra một giả thuyết về
phân phối hoặc về các tham số được khảo sát. Trong những điều kiện giống nhau, các
kiểm định này không mạnh bằng kiểm định tham số (việc phát hiện sự khác nhau hay
trình bày các phép kiểm phi tham số.
143
sự tồn tại một hiệu ứng trong đám đông có xác suất yếu hơn). Ví dụ kiểm định chi
bình phương [F, tr. 381-382]
Để giải quyết một bài toán TK như ước lượng khoảng tin cậy, KĐ giả thuyết
TK hoặc các nghiên cứu chuyên biệt cho các tình huống y học như trong các nghiên
cứu cắt ngang, cắt dọc, đoàn hệ, bệnh - chứng, thử nghiệm vaccine, nghiên cứu lâm
sàng đối chứng ngẫu nhiên thì công việc đầu tiên của nhà nghiên cứu là xác định cỡ
mẫu. Tuy nhiên, V1 chỉ trình bày cách xác định cỡ mẫu trong các bài toán ước
lượng khoảng tin cậy cho một trung bình và cho một tỷ lệ, không trình bày phương
pháp xác định cỡ mẫu cho các nghiên cứu chuyên biệt cho các tình huống y học.
Đối với một biến nhị phân, tỷ lệ thành công hay thất bại sẽ được so sánh giữa hai
=
=
nhóm. Để so sánh hai tỷ lệ, số người trong mỗi nhóm
được tính theo công
n
n E
n R
thức:
2
−
+
−
+
−
(
(1
)
(1
)
))
β
Z − 1
Z − α 1
/2
π π 2 (1 0 0
π E
E
=
n
π π π R R 2 δ
−
=
Với
là sự khác biệt về hiệu quả (sự khác biệt tối thiểu thể hiện trên lâm
δ π π E R
sàng liên quan đến tỷ lệ thành công π
E và π
R giữa hai nhóm) mong muốn và π0 là tỷ lệ
+ π π R
E
=
[F, tr.289]
thành công trong cả hai nhóm theo H0 và
π 0
2
Ngược lại, F trình bày đầy đủ phương pháp xác định cỡ mẫu cho các bài toán này.
Ví dụ 4.11 minh họa bài toán xác định cỡ mẫu trong nghiên cứu lâm sàng đối
chứng ngẫu nhiên được trình bày trong F.
Chúng ta muốn đánh giá về hiệu quả của phương pháp mới trong điều trị khối u ác
tính ở da sống sót sau 5 năm. Với phương pháp điều trị trước đây, tỷ lệ sống sót sau 5
năm là 60%. Chúng ta ta hy vọng tỷ lệ sống sót sau 5 năm khi điều trị bằng phương
pháp mới tăng thêm 20%. Cần bao nhiêu bệnh nhân trong mỗi nhóm với sai sót α =
5% và sai sót β = 10%.
2
+
−
+
−
−
×
=
= 108
n
2
(1, 28 0, 6(1 0, 6) 0,8(1 0,8) 1,96 2 0, 7(1 0, 7)) 0, 2
Như vậy cần chọn 108 người vào mỗi nhóm và tổng cộng là 216 người cho hai nhóm.
[F, tr.289]
Ví dụ 4.11
144
4.4. CÁC ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IA, O)
Khác với thể chế IV và IF, trong thể chế IA, trước khi học chuyên ngành khoa
học sức khỏe SV đã được trang bị các kiến thức cơ bản về khoa học tự nhiên, xã hội
và y học. Chính vì thế, việc dạy học XS-TK cho SV ở thể chế IA có thuận lợi là SV
đã có một khối lượng kiến thức chuyên ngành nhất định, tạo thuận lợi cho việc gắn
môn XS – TK với thực tiễn nói chung, Y học nói riêng.
Giáo trình A gồm 13 chương, trong đó chỉ có một chương duy nhất (chương 4)
trình bày các kiến thức về XS cơ bản và các phân phối XS thông dụng, 12 chương
còn lại tập trung vào các vấn đề về XS-TK cho chuyên ngành y. Hầu hết các ví dụ
đều là các nghiên cứu thực tế, dựa trên DL thực tế nhằm giải quyết các vấn đề mà y
học quan tâm. Điều này chứng tỏ, thể chế IA rất chú trọng đến vấn đề đào tạo nghề
nghiệp cho SV. Hơn nữa, những kiến thức về XS-TK được sử dụng trong các
nghiên cứu thực tế làm cho SV thấy được mục đích và ý nghĩa của môn học, từ đó
tạo động cơ và sự hứng thú trong học tập.
Trước khi phân tích, chúng tôi điểm lại ở đây nội dung chính của các chương
được trình bày một cách có hệ thống và chuyên sâu trong giáo trình A.
• Chương 1: Giới thiệu về nghiên cứu y học
Trong chương này, A trình bày mục đích, ý nghĩa của các nghiên cứu trong Y
học nói chung và trong dịch tễ học nói riêng.
• Chương 2: Thiết kế nghiên cứu trong Y học
Chương 2 trình bày các phương pháp thiết kế nghiên cứu trong Y học bao
gồm: nghiên cứu quan sát (báo cáo hàng loạt ca bệnh, nghiên cứu bệnh-chứng,
nghiên cứu cắt ngang, nghiên cứu cắt dọc, nghiên cứu đoàn hệ), nghiên cứu thực
nghiệm (thử nghiệm có đối chứng, thử nghiệm không đối chứng và thử nghiệm tự
đối chứng) và nghiên cứu tổng hợp. A cũng phân tích những thuận lợi và khó khăn
khi ứng dụng các phương pháp nghiên cứu nêu trên.
• Chương 3: Phân tích và biểu diễn dữ liệu trong bảng và đồ thị
Mục đích của chương là giới thiệu các loại DL khác nhau trong nghiên cứu y
học (định tính, định lượng); phân tích DL dựa vào trung bình, trung vị, yếu vị,
145
phương sai, độ lệch chuẩn, sai số chuẩn, hệ số biến thiên; cách trình bày DL trong
bảng, đồ thị, biểu đồ; phương pháp nhận diện DL có PPC hay không.
• Chương 4: Xác suất và các chủ đề liên quan đến quyết định rút ra từ dữ liệu
Ở đây A trình bày các khái niệm và quy tắc cơ bản của XS: Định nghĩa XS,
các công thức tính XS; biến ngẫu nhiên và hàm phân phối XS: phân phối nhị thức,
phân phối Poisson, PPC; phân phối mẫu, định lý và ứng dụng của định lý giới hạn
trung tâm; các khái niệm trong ước lượng khoảng tin cậy, KĐ giả thuyết TK.
• Chương 5: Các phương pháp nghiên cứu trên một nhóm đối tượng
Chương 5 trình bày ứng dụng của PPC và phân phối Student trong ước lượng
khoảng tin cậy và KĐ giả thuyết TK trên một nhóm đối tượng.
• Chương 6: Các phương pháp nghiên cứu trên hai nhóm đối tượng độc lập
Nội dung chương 6 giống chương 5 nhưng các nghiên cứu được thực hiện trên
hai nhóm đối tượng độc lập.
• Chương 7: Các phương pháp nghiên cứu về trung bình của ba hoặc nhiều hơn ba
nhóm đối tượng
Chương này giới thiệu phương pháp phân tích phương sai một yếu tố, hai yếu
tố không lặp và có lặp; các phương pháp phân tích phương sai phi tham số khi DL
quan sát không có PPC và phương sai các nhóm không đồng nhất.
• Chương 8: Các phương pháp nghiên cứu về quan hệ giữa các biến
Nội dung chính của chương là phương pháp hồi quy tuyến tính đơn biến,
phương pháp khảo sát tương quan dựa vào tỷ số chênh (OR) và nguy cơ tương đối
(RR)
• Chương 9: Phân tích sống sót
Chương này trình bày mục đích, ý nghĩa và phương pháp phân tích sống sót
dựa vào ước tính Kaplan-Meier và KĐ log-rank.
• Chương 10: Các phương pháp thống kê đa biến
Phân tích hồi quy và tương quan đa biến, hồi quy logistic, hồi quy phi tuyến là
những nội dung được đề cập trong chương.
• Chương 11: Nghiên cứu khảo sát
146
Ở đây, A trình bày các bước thực hiện một đề tài nghiên cứu y học: Xác định
câu hỏi nghiên cứu, xác định cỡ mẫu, thu thập DL, phân tích và xử lý DL và đưa ra
kết luận từ các kết quả phân tích.
• Chương 12: Phương pháp y học thực chứng và phân tích quyết định lâm sàng
- Các khái niệm trong y học thực chứng
- Độ chính xác của xét nghiệm
- Mô hình ngưỡng P-K
- Phương pháp tính giá trị tiên đoán (bảng 2×2, cây quyết định, tỷ cơ hội, phương
pháp Bayes)
- Đường cong ROC
• Chương 13: Đọc và phân tích các bài báo y học
Như vậy, nội dung trình bày trong A bao gồm các kiến thức về XS-TK trong
chẩn đoán – điều trị và nghiên cứu y học. Vấn đề đào tạo cho SV năng lực nghiên
cứu y học rất được A quan tâm. Các phương pháp, kỹ thuật cần thiết để thực hiện
một nghiên cứu y học được trình bày rất sâu và đầy đủ, từ thu thập, phân tích, xử lý
DL đến kết luận cuối cùng và cách đọc, phân tích, viết một bài báo y học.
Dưới đây chúng tôi sẽ tập trung phân tích chi tiết để làm rõ sự giống và khác
nhau giữa các giáo trình V1, F và A về kỹ thuật giải quyết bài toán KĐ giả thuyết
so sánh hai trung bình.
4.4.1. Sự giống nhau
• Cả ba giáo trình V1, F và A đều trình bày 3 kiểu nhiệm vụ liên quan đến bài
toán so sánh hai trung bình là
- Ttb1: So sánh trung bình thực nghiệm và lý thuyết
- Ttb2: So sánh hai trung bình thực nghiệm độc lập
- Ttb3: So sánh hai trung bình khi DL ghép cặp
• Về kỹ thuật thực hiện 3 kiểu nhiệm vụ trên:
- V1, F, A đều nhắc đến các bước: Đặt giả thuyết H0 và HA (H1), lựa chọn và
thực hiện phép kiểm, quyết định bác bỏ hay không bác bỏ giả thuyết H0
dựa vào giá trị ngưỡng.
147
- Các giả định của phép kiểm t (DL có PPC, phương sai đồng nhất, sự độc
lập của hai nhóm) đều được nêu trong cả ba giáo trình.
- Về cách chọn mức ý nghĩa (ngưỡng sai lầm loại 1), cả ba giáo trình đều thể
hiện việc chọn mức ý nghĩa nhỏ nhất khi bác bỏ giả thuyết H0 vì nhà
nghiên cứu không muốn bác bỏ H0 khi H0 đúng.
4.4.2. Sự khác nhau
• Cách đặt giả thuyết trong F và A bao gồm giả thuyết một đuôi hay hai đuôi
tùy theo mục đích của nhà nghiên cứu, trong khi ở V1 luôn là giả thuyết hai đuôi,
ngay cả khi nhà nghiên cứu muốn kiểm định sự lớn hơn hoặc nhỏ hơn của giá trị
trung bình. Hơn thế, A còn phân tích chọn giả thuyết một đuôi hoặc hai đuôi phải
Phép kiểm hai đuôi phù hợp khi nhà nghiên cứu không có sự mong đợi trước về giá trị
trong mẫu, họ muốn biết có hay không sự khác biệt giữa trung bình mẫu và trung bình dân
số theo cả hai hướng.
Phép kiểm một đuôi có thể được sử dụng khi nhà nghiên cứu có sự mong đợi về giá trị
trung bình mẫu và họ muốn kiểm tra xem nó lớn hơn hay nhỏ hơn giá trị trung bình của
dân số. [A, tr.104-105]
phù hợp với câu hỏi của bài toán KĐ giả thuyết:
• Về ký hiệu, các loại giả thuyết, giống như F, A dùng H0 để chỉ giả thuyết
không (null) và H1 để chỉ giả thuyết thay thế khi H0 bị bác bỏ.
Nếu không đủ cơ sở để bác bỏ giả thuyết không từ bằng chứng hiện có, A và F
0":
Nếu giả thuyết H0 bị bác bỏ vì bằng chứng thu được từ mẫu, thì giả thuyết thay thế
được khẳng định. Nếu bằng chứng không đủ để bác bỏ H0 thì nó được giữ lại nhưng
không có nghĩa là H0 đúng. Các nhà khoa học phân biệt giữa không bác bỏ và chấp
nhận giả thuyết, họ cho rằng một nghiên cứu sẽ tốt hơn có thể được thiết kế sao cho
H0 có thể bị bác bỏ. Vì vậy, theo truyền thống thì chúng ta không chấp nhận H0 từ
bằng chứng hiện tại, chúng ta chỉ đơn thuần khẳng định rằng nó không thể bị bác bỏ.
[A, tr. 104]
không dùng thuật ngữ “chấp nhận H0” mà dùng thuật ngữ "không bác bỏ H
• A luôn lựa chọn phép kiểm t để so sánh hai trung bình trong mọi trường hợp,
dù cỡ mẫu nhỏ hơn hay lớn hơn 30, phương sai đã biết hay chưa biết; trong khi V1
148
và F lựa chọn phép kiểm u(z) khi phương sai đã biết, chọn phép kiểm t khi cỡ mẫu
n < 30 và phương sai chưa biết.
Trước khi trình bày phép kiểm t, A có trình bày ba giả định của phép
- Dữ liệu quan sát trong mỗi nhóm có phân phối chuẩn
- Phương sai hai nhóm đồng nhất
- Hai nhóm đối tượng được nghiên cứu độc lập [A, tr.138-140]
kiểm này:
Viêc giả định dữ liệu có phân phối chuẩn bị vi phạm thì sẽ làm cho giá trị p thấp hơn
giá trị thực của nó, dẫn đến dễ dàng bác bỏ giả thuyết không và kết luận sự khác biệt
về trung bình giữa hai nhóm không có ý nghĩa. [A, tr. 138-139]
A giải thích rằng:
• Kỹ thuật KĐ trong A được chi tiết hóa thành 6 bước (đặt giả thuyết TK, xác
định phép kiểm phù hợp, lựa chọn mức ý nghĩa, xác định giá trị ngưỡng, tính giá trị
TK và kết luận). Điều này không được nói rõ trong V1 và F.
Trong các ví dụ, ở bước xác định phép kiểm phù hợp, A luôn phân tích bài
toán cần giải quyết để chọn phép kiểm hai đuôi hay một đuôi.
Cũng trong các ví dụ, A thường nhắc đến điều kiện để thực hiện phép kiểm đã
chọn (trong trường hợp so sánh hai trung bình thì đó là phép kiểm t và điều kiện của
nó là DL có PPC, phương sai đồng nhất). Dưới đây là một ví dụ như thế
(ví dụ 4.12).
Đo lượng 7α-HCO trước và sau 1 tháng phẫu thuật cắt bỏ túi mật của 51 bệnh nhân.
Gọi d là hiệu số của lượng 7α-HCO trước và sau phẫu thuật, kết quả
d =
21, 22
ng/mL và độ lệch chuẩn là
ds = 26,68 ng/mL. Các nhà nghiên cứu muốn kiểm tra sự
thay đổi này có ý nghĩa thống kê hay không.
Bước 1: Đặt giả thuyết
Gọi δlà hiệu số của sự khác biệt về lượng 7α-HCO trước và sau phẫu thuật. Chúng ta
muốn bác bỏ giả thuyết không trong hai tình huống khi 7α-HCO tăng và giảm có ý
δ
=
δ
nghĩa nên cần sử dụng phép kiểm hai đuôi với giả thuyết:
H
:
0;
H
:
≠ 0
0
1
Bước 2: Quyết định phép kiểm phù hợp
Ví dụ 4.12
149
Giả sử sự khác biệt d có phân phối chuẩn, phép kiểm phù hợp là phép kiểm t ghép
cặp với
−
=
~ Student(n-1)
t
0 n
d s /d
Bước 3: Lựa chọn mức ý nghĩa: chọn α = 0,01
=
Bước 4: Xác định giá trị ngưỡng:
C t=
2, 682
0,01(50)
−
−
d
=
=
=
Bước 5: Thực hiện tính toán:
t
5, 68
/
0 n
21, 22 0 26, 68 / 51
s d
Bước 6: Kết luận: Vì t > 2,682 nên bác bỏ H0, tức là lượng 7α-HCO thực sự khác biệt
trước và sau phẫu thuật cắt túi mật. ( p < 0,01) [A, tr.117-118]
• V1 không trình bày cách xử lý DL khi không thỏa mãn điều kiện của phép
kiểm t, trong khi ở F và A đều nêu phương pháp hoán chuyển DL hoặc sử dụng
phép kiểm phi tham số Wilcoxon khi DL không có PPC.
Ngoài ra, khi phân phối của DL bị lệch, A còn trình bày phương pháp hoán
chuyển theo hàm ln (cơ số e). Sau đó, A còn trình bày phương pháp hoán chuyển
Mặc dù cách hoán chuyển này không thường được sử dụng trong y học như hoán
chuyển theo hàm logarithm nhưng nó rất hữu ích khi hoán chuyển bằng hàm logarithm
làm cho dữ liệu bị lệch quá mức. [A, tr.123]
DL theo hàm căn bậc hai và chú ý rằng:
Khi tất cả các phương pháp hoán chuyển DL không làm cho DL có PPC, A
trình bày các phép kiểm phi tham số để khắc phục tình trạng này. Chẳng hạn, phép
kiểm Wilcoxon (Mann-Whitney) trong so sánh ghép cặp. Chúng tôi sẽ không đi sâu
vào các chi tiết toán học ở đây.
Cuối cùng, khi phương sai không đồng nhất, A đưa ra phương án thu thập DL
có cỡ bằng nhau trong cả hai nhóm.
Chúng tôi tóm tắt trong Bảng 4.5 về sự khác nhau giữa 3 giáo trình trong
việc giải quyết ba kiểu nhiệm vụ liên quan đến bài toán so sánh hai trung bình.
150
Bảng 4.5. Sự khác nhau giữa 3 giáo trình V1, F và A
V1
F
A
Nội dung
Có
Tính toán cỡ mẫu Thu thập DL Đặt giả thuyết
Lựa chọn phép kiểm
Không DL giả định Hai đuôi n > 30: phép kiểm u (PPC) n ≤ 30: phép kiểm t (phân phối Student)
Có DL giả định hoặc thực tế. DL thực tế Một đuôi/ hai đuôi n > 30: phép kiểm z (PPC) n ≤ 30: phép kiểm t (phân phối Student)
Một đuôi/ hai đuôi n > 30: phép kiểm t (phân phối Student) n ≤ 30: phép kiểm t (phân phối Student)
Có
Có
Có
Trình bày một phần riêng.
Không
Không
Phân tích các điều kiện của phép kiểm Kiểm tra các điều kiện của phép kiểm Phương pháp xử lý khi DL không có PPC
Kết luận
Hoán chuyển DL hoặc sử dụng phép kiểm phi tham số. Dựa vào giá trị ngưỡng C và giá trị p
Có kiểm tra trước khi thực hiện phép kiểm Hoán chuyển DL hoặc sử dụng phép kiểm phi tham số. Dựa vào giá trị ngưỡng C và giá trị p
Dựa vào giá trị ngưỡng C
4.5. KẾT LUẬN CHƯƠNG 4
PPC có vai trò quan trọng trong XS cũng như trong TK, là cơ sở cho hầu hết
các suy diễn TK. Những ứng dụng quan trọng của PPC được sử dụng trong XS
trong các bài toán tính xấp xỉ các giá trị XS của biến ngẫu nhiên có phân phối rời
rạc như phân phối nhị thức trong thể chế IV. Trong TK, PPC cùng với định lý giới
hạn trung tâm đã giải thích hầu hết các nguyên lý TK thể hiện trong các bài toán
ước lượng khoảng tin cậy và KĐ giả thuyết TK.
Trong các bài toán KĐ giả thuyết TK về trung bình, một trong những điều
kiện quan trọng khi sử dụng phép kiểm t là DL có PPC. Cả ba giáo trình V1, F và A
đều nêu yêu cầu này, nhưng trong các ví dụ và bài tập, việc kiểm tra các điều kiện
này không được yêu cầu thực hiện. Nếu DL không tuân theo PPC thì phải giải quyết
thế nào? Câu hỏi này không được đặt ra và dĩ nhiên không được trả lời trong thể chế
IV. Tuy nhiên, câu hỏi này đã được nêu ra trong thể chế IF, IA và phương pháp xử
ký khi điều kiện không thỏa mãn đã được nghiên cứu.
Liên quan đến bài toán KĐ giả thuyết TK về so sánh hai trung bình thực
nghiệm độc lập, phép kiểm một đuôi không hiện diện trong V1. Đây là một sự khác
biệt với F và A. Sự thiếu hụt phép kiểm một đuôi khiến SV thiếu kỹ thuật để KĐ
151
những giả thuyết trong đó người ta cần biết trung bình nào lớn hơn trung bình nào.
Mà những giả thuyết thuộc loại này lại rất thường gặp trong các nghiên cứu y học.
Mục tiêu đào tạo nghề đã được thể hiện trong ba thể chế IV, IF và IA đó là các
kiểu nhiệm vụ được đặt ra nhằm giải quyết các bài toán của y học, cụ thể là trong
bào chế, kiểm nghiệm, phát triển các loại thuốc; đánh giá và phát triển các phương
pháp, các thuật điều trị. Các kỹ thuật và công nghệ cũng được xây dựng để giải
quyết các kiểu nhiệm vụ này. Mục tiêu này càng thể hiện rõ hơn trong IA.
Từ những phân tích quan hệ thể chế R(IV, O), giới hạn vào kiểu nhiệm vụ so
sánh hai trung bình thực nghiệm độc lập, chúng tôi rút ra giả thuyết khoa học sau
đây:
Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép
giải thích sai lầm của SV:
R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so
sánh hai trung bình thực nghiệm độc lập.
R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung
bình thực nghiệm độc lập.
Kiểm chứng giả thuyết này là một trong những nội dung chính được chúng tôi
thực hiện trong phần thực nghiệm của chương 5.
152
CHƯƠNG 5
NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA GIẢNG VIÊN
VÀ QUAN HỆ CÁ NHÂN CỦA SINH VIÊN VỚI ĐỐI TƯỢNG O
Nghiên cứu thực tế đào tạo được thực hiện trên hai đối tượng chủ chốt của thể
chế IV - GV và SV. Mục đích đầu tiên là kiểm chứng tính thỏa đáng của giả thuyết
khoa học đã được hình thành từ phân tích thể chế của chúng tôi.
Như vậy, phần thứ nhất của chương trình bày một nghiên cứu thực tế DH của
GV. Quan sát thực hành của GV nhằm làm rõ bước chuyển hóa sư phạm từ tri thức
giáo khoa đến tri thức được dạy.
Liệu thực hành DH của GV có cho phép làm rõ ảnh hưởng của quan hệ thể
chế lên ứng xử của cá nhân của GV với "tri thức cần dạy" và do đó sẽ cho phép
củng cố (hoặc không) giả thuyết khoa học đã đặt ra? Câu hỏi ấy dẫn chúng tôi đến
một nghiên cứu quan sát lớp học về tiết học KĐ giả thuyết TK so sánh hai trung
bình thực nghiệm độc lập.
Phần thứ hai của chương là một nghiên cứu thực nghiệm trên đối tượng SV
năm thứ hai khoa Y và Khoa Dược ngay sau khi họ vừa học xong chương "Kiểm
định giả thuyết thống kê". Với thực nghiệm được thiết kế, chúng tôi mong muốn
kiểm tra tính thỏa đáng của giả thuyết về sự tồn tại của hai quy tắc hợp đồng DH đã
rút ra từ phân tích quan hệ thể chế đối với O.
5.1. NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA GIẢNG VIÊN
Chúng tôi đã quan sát tiết dạy của một GV Đại học Y dược Tp HCM. Trong
tiết dạy này SV được nghiên cứu bài toán KĐ giả thuyết TK về so sánh hai trung
bình thực nghiệm độc lập. Bằng công cụ của Thuyết nhân học, chúng tôi sẽ xác định
những tổ chức toán học được dạy và tiến hành phân tích, đánh giá các tổ chức
didactic mà GV đã triển khai để truyền bá các tổ chức toán học liên quan đến đối
tượng O - một tri thức quan trọng và rất cần thiết trong nghiên cứu y học và thực
hành nghề nghiệp của các bác sĩ tương lai.
153
5.1.1. TỔ CHỨC TOÁN HỌC CẦN DẠY VÀ ĐƯỢC DẠY
Theo phân tích ở chương 4, các tổ chức toán học liên quan đến bài toán so
sánh hai trung bình được hình thành từ 3 kiểu nhiệm vụ sau đây:
Ttb1: So sánh trung bình thực nghiệm và trung bình lý thuyết
Ttb2: So sánh hai trung bình thực nghiệm độc lập
Ttb3: So sánh hai trung bình khi có số liệu đôi
Các kiểu nhiệm vụ trên đều là kiểu nhiệm vụ toán học vì kỹ thuật giải quyết
các kiểu nhiệm vụ này phải sử dụng công thức toán học để tính các giá trị như trung
bình, phương sai, độ lệch chuẩn, sai số chuẩn và các giá trị TK của phép kiểm u và
t. Mặc dù chúng giống nhau về mặt hình thức, nhưng điều kiện hợp thức thì khác
nhau khi sử dụng phép kiểm t và không được trình bày tường minh trong giáo trình
=
(
,...,
)
V1 cũng như trong giờ học trên lớp. Các điều kiện đó là:
x i
x n
x x , 1 2
thu thập từ dân số có PPC - Đối với kiểu nhiệm vụ Ttb1: DL
- Đối với kiểu nhiệm vụ Ttb2: DL thu thập từ 2 dân số có PPC và phương sai đồng
2 σ σ= 2
2 1
=
−
=
n 1,..., )
nhất
x i
x 1 i
i 2 ( x i
có PPC. - Đối với kiểu nhiệm vụ Ttb3: DL
t
Trong tiết học được quan sát SV chỉ nghiên cứu kiểu nhiệm vụ Ttb2. Đối với
2 u tbτ và 2
tbτ . Những gì quan sát
2 2
kiểu nhiệm vụ này, V1 đã đưa vào hai kỹ thuật
được cho thấy GV đã trình bày hai kỹ thuật đó.
5.1.2. TỔ CHỨC DIDACTIC
Từ băng ghi âm và những ghi chép khi quan sát, chúng tôi dựng lại biên bản
của tiết học và biên bản này được trình bày trong phần Phụ lục 3 của luận án. Trong
phần dưới, chúng tôi sẽ đi dọc theo biên bản tiết học để xác định tổ chức didactic
mà GV đã triển khai để làm cho SV nghiên cứu Ttb2.
Theo cách tiếp cận của Thuyết nhân học, hoạt động DH được xem như hoạt
động nghiên cứu một đối tượng O nào đó, cụ thể hơn là nghiên cứu một praxéologie
liên quan đến O. Giả sử T là kiểu nhiệm vụ mà từ đó praxéologie cần nghiên cứu
được hình thành. Hoạt động nghiên cứu này phải trải qua sáu thời điểm:
154
Thời điểm thứ nhất: thời điểm gặp gỡ lần đầu tiên với kiểu nhiệm vụ T.
Thời điểm thứ hai: thời điểm nghiên cứu kiểu nhiệm vụ T và xây dựng kỹ
thuật giải quyết T.
Thời điểm thứ ba: thời điểm làm việc với tổ chức toán học đã hoặc đang được
tạo ra.
/
Thời điểm thứ tư: thời điểm xây dựng môi trường công nghệ - lý thuyết, tức là
]θ Θ .
thời điểm tạo ra khối [
[T/
/
/
' /
]
/
τ θ Θ hoặc [T/ ]
τ θ Θ bằng cách chỉ ra các thành phần của nó.
Thời điểm thứ năm: thời điểm thể chế hóa, là thời điểm trình bày rõ tổ chức
Thời điểm thứ sáu: thời điểm đánh giá. Ở thời điểm này, GV đánh giá về các
tổ chức toán học đã được triển khai trong lớp học và cũng là lúc đánh giá HS về khả
năng làm chủ tổ chức toán học đã được tạo ra.
Dọc theo biên bản, chúng tôi sẽ xác định các thời điểm nghiên cứu này. Biên
bản ghi lại tất cả những gì xẩy ra trong lớp tuần tự theo thời gian. Căn cứ vào hoạt
động của GV và SV, chúng tôi phân biên bản tiết học thành 24 đoạn (xem Phụ lục
3). Những trích dẫn dưới đây đều lấy ra từ biên bản tiết học.
• Đoạn 1 – 8: GV ôn lại các bước thực hiện bài toán KĐ giả thuyết TK, nhấn
mạnh tầm quan trọng của việc kiểm tra các điều kiện của các phép kiểm: “Mỗi phép
kiểm đều có điều kiện áp dụng nghiêm ngặt, nếu không kiểm tra những điều kiện
này thì kết luận rút ra từ các phép kiểm có thể không đáng tin cậy, thậm chí sai
lầm”.
Như vậy, GV có nhắc đến điều kiện áp dụng của những phép kiểm đã học
trong bài toán so sánh các tỷ lệ trong bài học trước, đó chính là phép kiểm u và phép
kiểm chi bình phương. Thực tế cho thấy việc kiểm tra điều kiện của các phép kiểm
này khá dễ dàng và có thể thực hiện một cách nhanh chóng: “Chẳng hạn trong phép
kiểm u để so sánh hai tỷ lệ thì điều kiện cần kiểm tra là: np ≥ 5; n(1-p) ≥ 5; 0,1< p
< 0,9. Còn trong phép kiểm chi bình phương thì điều kiện đó là tần số lý thuyết
không nhỏ hơn 5”.
155
Ngay trong đoạn 1, GV đã giới thiệu mục đích của bài học: “Hôm nay chúng
ta học tiếp bài toán so sánh hai trung bình bằng phép kiểm u và t. So sánh hai trung
bình là bài toán tương đối phổ biến trong TK y học, nó dùng để so sánh các giá trị
trung bình của các biến định lượng”.
Khi khảo sát các nghiên cứu trong y học có sử dụng XS-TK, chúng tôi nhận
thấy có hai bài toán so sánh hai đại lượng, chủ yếu là hai trung bình và hai tỷ lệ. Để
đánh giá tác dụng của một loại thuốc hoặc một phương pháp điều trị mới, người ta
phải chia đối tượng nghiên cứu thành hai nhóm là nhóm bệnh (nhóm tác động thật
hoặc dùng thuốc thật) và nhóm chứng (nhóm tác động giả hoặc dùng giả dược).
Bước tiếp theo là theo dõi và ghi nhận các thông số cần quan tâm, thường là trung
bình hoặc tỷ lệ của hai nhóm này và dùng các phép kiểm TK để so sánh và đánh giá
hiệu quả giữa hai nhóm. So sánh hai tỷ lệ là các bài toán dễ thực hiện vì DL mang
tính định tính và thể hiện bằng tỷ lệ phần trăm, trong khi đó so sánh hai trung bình
thường phải làm việc trên một bộ DL định lượng và càng khó khăn hơn nếu cỡ mẫu
khảo sát quá lớn hoặc quá nhỏ. Nếu cỡ mẫu quá lớn thì phải tốn kém về thời gian và
kinh phí thực hiện khảo sát, tốn thời gian để nhập và phân tích DL nhưng có lợi ở
chỗ DL hầu như có PPC hoặc phân phối xấp xỉ chuẩn theo định lý giới hạn trung
tâm - điều kiện cần thiết của các phép KĐ TK và phân tích tương quan định lượng,
…. Ngược lại, nếu cỡ mẫu quá nhỏ thì ít tốn kém về thời gian và kinh phí khảo sát,
phân tích DL nhưng DL có thể không tuân theo PPC nên rất dễ sai lầm trong phân
tích TK, Câu khẳng định của GV: “So sánh hai trung bình là bài toán tương đối phổ
biến trong TK y học” muốn nhắc nhở SV về mức độ phổ biến và tầm quan trọng của
bài toán so sánh hai trung bình.
Cả hai biến ngẫu nhiên u có PPC và t có phân phối Student đều đã được học
trong chương “Các phân phối xác suất thường dùng” và chương “Lý thuyết ước
lượng” của giáo trình V1 nên SV đều đã quen thuộc với các bài toán liên quan đến
hai phân phối này.
GV nhấn mạnh về tầm quan trọng của bước đặt giả thuyết TK đặc biệt là giả
0H (giả thuyết không), giả thuyết
AH (giả thuyết thay thế khi
0H bị bác bỏ)
thuyết
156
0H . Trong bài toán KĐ giả thuyết TK,
mặc định là giả thuyết hai đuôi, đối lập với
0H
bước đặt giả thuyết rất quan trọng vì kết quả bác bỏ hay không bác bỏ giả thuyết
sẽ ảnh hưởng đến kết luận cuối cùng của một nghiên cứu trong y học. Đối với SV,
họ đã được học các phép KĐ giả thuyết khi so sánh hai tỷ lệ ở bài học trước nên đến
bài học này họ đã nắm được các bước thực hiện bài toán KĐ trong đó có bước đặt
giả thuyết TK. Điều này thể hiện ở trong cách hiểu và cách trả lời của SV: “Bước 1
là quan trọng nhất vì nếu đặt giả thuyết sai thì sẽ dẫn đến kết luận sai”. Họ cũng
trình bày cách đặt giả thuyết TK giống như những gì đã được học trong bài mở đầu
về KĐ giả thuyết TK: “Mình phải đặt giả thuyết với mục đích bác bỏ, giả thuyết
này phải đặt ngược với mục đích nghiên cứu, giả thuyết này gọi là giả thuyết không,
tức là không có sự khác biệt.”
Khi GV yêu cầu SV trình bày rõ hơn về cách đặt giả thuyết TK và nêu câu
hỏi: “Làm sao mình biết giả thuyết mình đặt là đúng hay sai” thì SV đã thể hiện sự
Ví dụ ở bài học trước, để so sánh hiệu quả của hai phương pháp điều trị bệnh A ta so
sánh tỷ lệ khỏi bệnh của hai phương pháp này bằng phép kiểm u. DL thu thập được
cho thấy tỷ lệ khỏi bệnh của hai phương pháp là khác nhau, muốn chứng tỏ điều này
mình đặt giả thuyết
0H đối lập với DL thực tế: Tỷ lệ khỏi bệnh của hai phương pháp
và
. Nếu chấp nhận
không khác nhau, tức là
p≠ 2
:H p 0 1
p= 2
:AH p 1
0H thì kết
luận hiệu quả của hai phương pháp như nhau và nếu bác bỏ
0H thì kết luận
ngược lại”.
lúng túng và trả lời câu hỏi này bằng cách đưa ra một ví dụ đã được học:
Trước khi bước vào nội dung chính của bài học, GV thực hiện pha thể chế hóa
để khẳng định lại về những nội dung đã thảo luận.
• Đoạn 9 chính là thời điểm gặp gỡ đầu tiên với kiểu nhiệm vụ Ttb2: Lựa chọn
phép kiểm và tính các giá trị TK. Thời điểm này diễn ra thông qua lời giới thiệu
Trong buổi học hôm nay, chúng ta sẽ tập trung nghiên cứu lý thuyết và thực hành giải
bài toán 1: So sánh hai trung bình thực nghiệm độc lập. Để so sánh hai trung bình ta
sử dụng 2 phép kiểm là u và t.
của GV:
157
Câu hỏi của GV “Vấn đề đặt ra là làm thế nào để so sánh trung bình của hai
dân số?” là câu hỏi quen thuộc với SV, vì họ đã có phương pháp so sánh hai tỷ lệ
của dân số trong bài học trước. Điều khác biệt trong bài học này là “so sánh hai
trung bình của dân số”
• Đoạn 10 là thời điểm nghiên cứu kiểu nhiệm vụ Ttb2. GV đóng vai trò chủ
động trong thời điểm này. GV là người đặt câu hỏi và cũng là người trả lời: “Đương
nhiên là chúng ta không thể khảo sát toàn bộ hai dân số đó để tính ra số trung bình
của đặc tính cần nghiên cứu. Các em đã học phương pháp của TK rồi, đó là: Xác
định cỡ mẫu, tiến hành lấy mẫu và sử dụng phương pháp KĐ giả thuyết TK để so
sánh hai trung bình”.
Cụ thể là ta phải lấy hai mẫu độc lập từ hai dân số đó và so sánh hai trung bình thực
nghiệm này để kết luận cho hai trung bình dân số. Để thực hiện điều này ta chia bài
toán thành 2 trường hợp: đã biết σ và chưa biết σ”
GV cũng gợi mở một kỹ thuật để giải quyết kiểu nhiệm vụ Ttb2:
Ttb2 là kiểu nhiệm vụ toán học vì để giải quyết kiểu nhiệm vụ này cần phải tính
toán các giá trị TK u hoặc t dựa vào các tham số TK như cỡ mẫu, trung bình,
phương sai. Những tính toán này không khó để thực hiện bằng máy tính bỏ túi
nhưng đòi hỏi SV phải cẩn thận và tính toán chính xác vì kết quả của các tính toán
t
này sẽ ảnh hưởng đến kết luận cuối cùng của bài toán.
2 u tbτ và 2
2 tbτ đều 2
• Đoạn 11, 12 là thời điểm làm việc với kỹ thuật. Hai kỹ thuật
được GV đưa vào để giải quyết hai tình huống thông qua hai ví dụ minh họa cho hai
Tương tự trong bài toán ước lượng khoảng tin cậy, σđã biết khi đã có nghiên cứu về
đặc tính X mà chúng ta đang quan tâm hoặc trong y văn đã công bố rồi. Chẳng hạn,
quyển sách Các giá trị sinh học người Việt Nam bình thường thập kỷ 90 - Thế kỷ XX
cho biết chiều cao trung bình của nam thanh niên Việt Nam trên 18 tuổi là 163 cm và
độ lệch chuẩn là 4 cm. Trong trường hợp này, khi nghiên cứu về chiều cao của nam
thanh niên Việt Nam chúng ta có thể coi như σ = 4 đã biết. Ngược lại, những nghiên
cứu mới thì chưa biết σ.
trường hợp đã biết phương sai và chưa biết phương sai:
158
t
2 u tbτ và 2
2 2
tbτ được vận hành khá tốt, đúng theo các bước đã được
Hai kỹ thuật
nêu ra: Đặt giả thuyết, tính các giá trị TK của u hoặc t tương ứng với trường hợp đã
biết phương sai hoặc chưa biết phương sai, cuối cùng là đưa ra kết luận dựa vào quy
0H . Việc tính toán các giá trị của
tắc quyết định bác bỏ hay không bác bỏ giả thuyết
u và t được thực hiện khá nhanh chóng với sự hỗ trợ của máy tính bỏ túi.
Vấn đề đáng chú ý là khi trình bày lý thuyết, trong bước đặt giả thuyết TK,
GV chỉ giới thiệu giả thuyết chính là giả thuyết hai đuôi, không trình bày giả thuyết
:AH µ µ≠
:H µ µ= 1 2
0
1
2
+
−
2)
một đuôi: “Đặt giả thuyết và ”. Các giá trị ngưỡng cố định
t n ( α 1
n 2
như 1,96 và 2,58 trong phép kiểm u hoặc trong phép kiểm t tương ứng
với mức sai lầm loại 1 là các giá trị ngưỡng hai đuôi. Điều này phù hợp với quan hệ
thể chế R(IV, O) mà chúng tôi đã phân tích trong chương 4 và cũng phù hợp với hai
ví dụ mà GV minh họa ngay sau đó.
t
2 u tbτ và 2
2 2
tbτ . Thời điểm này diễn ra sôi nổi nhất vì SV rất quan tâm đến điều kiện
• Đoạn 13 - 20 là thời điểm xây dựng môi trường công nghệ, lý thuyết cho
Khi sử dụng phép kiểm t, tại sao trong lý thuyết có yêu cầu muốn so sánh được hai
trung bình thì phải giả sử
?
2 σ σ= 2
2 1
thực hiện của hai phép kiểm, đặc biệt là phép kiểm t:
Thực ra nếu SV chú ý kỹ phần lý thuyết thì sẽ thấy được 2 điều kiện của phép
Ta muốn sánh hai số trung bình
,µ µ của hai dân số A và B có phân phối chuẩn,
1
2
2
2
phương sai lần lượt là
1σ và
2σ chưa biết. Muốn so sánh được thì ta phải giả sử
.
2 σ σ= 2
2 1
kiểm t, đó là: Hai dân số A và B có PPC và hai phương sai phải đồng nhất.
Để trả lời câu hỏi nêu trên, GV không giải thích lí do tại sao phải có giả thiết
2 σ σ= 2
2 1
mà khẳng định rằng: “Đó là điều kiện của phép kiểm t, nó cũng giống như
điều kiện của phép kiểm u và Chi bình phương mà các em đã học trong bài
trước đó”.
GV cũng đưa ra giải pháp để kiểm tra điều kiện hai phương sai đồng nhất, đó là sử
dụng phép kiểm F. Tuy nhiên, vì phép kiểm này chưa được học nên coi như điều
159
kiện phương sai đồng nhất đã thỏa mãn và như vậy SV không cần kiểm tra điều này
trong ví dụ về phép kiểm t đã trình bày: “bài học này chúng ta chưa có công cụ
nhưng trong bài học sau về phép kiểm F, chúng ta sẽ học phương pháp so sánh hai
phương sai bằng phép kiểm F”. Phép kiểm F dùng để so sánh hai phương sai mà
=
F
GV nhắc tới được thực hiện rất đơn giản vì giá trị của F là tỷ số của phương sai lớn
2 s 1 2 s 2
và phương sai nhỏ của hai mẫu DL ( , theo V1, tr.172-173) nên sẽ hợp lí hơn
nếu V1 đưa phép kiểm này vào trước bài học so sánh hai trung bình và GV dạy
phép kiểm F trước các phép kiểm u và t.
Việc so sánh hai phương sai có thể dẫn đến kết luận hai phương sai không
đồng nhất. Khi đó phải giải quyết bài toán so sánh hai trung bình bằng phép kiểm t
như thế nào? Trong các ví dụ và bài tập của V1, DL đều cho ở dạng thỏa mãn các
điều kiện của phép kiểm t. Chúng tôi dự đoán nếu cho một bài toán mà DL hai mẫu
có phương sai không đồng nhất, tức là vi phạm điều kiện của phép kiểm t, thì có thể
sẽ có sai lầm xảy ra vì với kỹ thuật hiện có mà giáo trình và GV cung cấp, SV luôn
mặc định điều kiện này đã thỏa mãn. Điều này thể hiện trong giờ học khá rõ khi mà
ở đó GV không trình bày trường hợp DL vi phạm điều kiện phương sai không đồng
nhất khi thực hiện phép kiểm t và cũng không có SV nào hỏi thêm về trường hợp
này. Đây là một sự khác biệt giữa tri thức bác học với tri thức trong chương trình và
giáo trình cũng như tri thức được dạy.
Điều kiện DL có PPC có thể được giải thích bằng định lý giới hạn trung tâm
khi cỡ mẫu khảo sát lớn hơn 30, trong trường hợp ngược lại thì sử dụng phép kiểm
chi bình phương. Cả hai kiến thức này đã được học trong các bài học trước nhưng
hầu như nó là một bài toán độc lập không liên quan đến kiểu nhiệm vụ Ttb2
trong bài học này. Trước đó SV cũng không biết thực hiện KĐ sự phù hợp của DL
với PPC để làm gì vì bài toán KĐ sự phù hợp của DL là một ví dụ trong số nhiều ví
dụ minh họa cho các ứng dụng của phép kiểm chi bình phương mà không có mục
đích nào khác.
160
Cũng cần phải nhắc lại rằng, phép kiểm chi bình phương mà SV đã học trong
bài học trước chỉ thực hiện được khi DL đã ghép lớp, trong trường hợp DL “thô”
hoặc bài toán không cho DL mà chỉ cho các giá trị về cỡ mẫu, trung bình, phương
sai thì không thể thực hiện bằng phép kiểm chi bình phương. Mặt khác phép kiểm
chi bình phương phải tính toán rất nhiều, nhất là việc tính giá trị XS cho từng lớp
DL để tính tần số lý thuyết, nên nếu cho thời gian ít thì SV không thể hoàn thành
được yêu cầu này.
Mặc dù giáo trình V1 và GV không công bố, nhưng nếu dùng các kỹ thuật
khác nhau để kiểm tra sự phù hợp của DL với PPC trong các ví dụ và bài tập của
V1 thì điều kiện này hoàn toàn thỏa mãn.
Như vậy, điều kiện DL có PPC của phép kiểm t có được GV nhắc đến trong
phần lý thuyết (dù không tường minh). Tuy nhiên, nó không được SV nhìn nhận
như một điều kiện bắt buộc của phép kiểm t, vì như phân tích ở trên thì DL trong
các ví dụ và bài tập đều đã thỏa mãn điều kiện này. Hơn nữa nếu thực hiện KĐ bằng
phép kiểm chi bình phương thì thời gian thực hiện khá lâu, nếu không thực hiện
được bằng phép kiểm chi bình phương (khi cho DL thô hoặc không cho DL mà chỉ
cho các thông số cần thiết như cỡ mẫu, trung bình, phương sai) thì hiện tại SV cũng
chưa có kỹ thuật nào khác. Điều đó cho phép chúng tôi củng cố giả thuyết
nghiên cứu
• Đoạn 21-22 là thời điểm làm việc với đối thuyết HA phát biểu ở dạng “một
bên” (µ > µ’ hoặc µ < µ’). Chính SV là người nêu vấn đề khi câu hỏi của bài toán
không chỉ là “kết luận” chung chung. Nếu có sự khác biệt về trung bình giữa hai
Câu hỏi của cả hai ví dụ vừa rồi là so sánh sự khác biệt của hai giá trị trung bình, nếu
có sự khác biệt thì ta cần biết trung bình nhóm nào lớn hơn. Chẳng hạn, trong ví dụ 2
câu hỏi là: “Hàm lượng Na+ trong máu người có huyết áp cao có cao hơn so với
người có huyết áp bình thường không?” thì làm sao?
nhóm, muốn đánh giá cụ thể hơn thì phương pháp KĐ là gì:
Theo lý thuyết KĐ giả thuyết TK, để kết luận về hàm lượng trung bình Na+
của nhóm nào cao hơn cần phải sử dụng phép kiểm một đuôi. Nhưng GV đã bỏ qua
161
cơ hội khiến SV thấy được sự cần thiết của phép kiểm một đuôi và nghiên cứu thêm
một kỹ thuật khác để bổ sung cho tổ chức toán học liên quan đến Ttb2 còn được xây
dựng chưa đầy đủ trong V1. Cách xử lý của GV ở đây là vẫn dùng phép kiểm
Chúng ta vẫn làm như bình thường và dẫn đến kết luận bác bỏ giả thuyết H0 , tức là sự
khác biệt về hàm lượng Na+ trung bình trong máu người có huyết áp cao và người có
huyết áp bình thường có ý nghĩa. Mặt khác ta thấy trong thực nghiệm, trung bình về
hàm lượng Na+ trong máu người có huyết áp cao lớn hơn người có huyết áp bình
thường. Từ đó có thể trả lời được câu hỏi của bạn.
hai đuôi:
Từ câu hỏi của SV và phân tích của GV, có thể thấy SV được phép dùng phép
kiểm hai đuôi để giải quyết mọi tình huống so sánh trung bình của hai nhóm: khác
nhau, cao hơn, thấp hơn trong các bài toán KĐ giả thuyết TK.
Phân tích trên đây cho phép khẳng định sự tồn tại của giả thuyết khoa học thứ
nhất (Giả thuyết 1): Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép
giải thích sai lầm của SV:
R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so
sánh hai trung bình thực nghiệm độc lập.
R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung
bình thực nghiệm độc lập.
Trong bài học hôm nay các em đã biết giải quyết bài toán so sánh hai trung bình thực
nghiệm độc lập. Các bước thực hiện của bài toán này cũng giống như thực hiện bài
toán so sánh hai tỷ lệ. Điều khác biệt chỉ là điều kiện áp dụng của các phép kiểm u và
t, chúng ta cần chú ý để sử dụng phép kiểm phù hợp với yêu cầu của mỗi bài toán.
• Đoạn 23 là thời điểm thể chế hóa:
Thời điểm này diễn ra nhanh chóng vì trong các bước của bài toán KĐ giả
thuyết TK chỉ có phần kiểm tra điều kiện áp dụng là có sự khác biệt đối với mỗi
phép kiểm, các bước khác hầu như đã quen thuộc đối với SV. Trong thời điểm thể
chế hóa, GV có nhắc đến việc sử dụng phép kiểm u hoặc t cho phù hợp nhưng
không nhắc đến phép kiểm một đuôi. Phải chăng là vì phép kiểm này không được
162
đưa vào chương trình và giáo trình ? Ứng xử của GV được quan sát cho thấy ảnh
hưởng khá mạnh của quan hệ thể chế lên quan hệ cá nhân của GV.
• Đoạn 24 là thời điểm đánh giá: GV đánh giá về kỹ thuật, đồng thời GV cũng
khẳng định kỹ thuật đưa vào chưa đầy đủ và cần phải tìm hiểu thêm để giải quyết
Mặc dù chưa bao quát hết các yêu cầu của mỗi bài toán nhưng kỹ thuật KĐ giả thuyết
TK mà chúng ta đã được học trong bài học này cơ bản đã giải quyết các tình huống mà
sau này chúng ta phải đối mặt. Nếu có thời gian các em nên tham khảo thêm các tài
liệu được liệt kê ở phần cuối của giáo trình để tìm hiểu thêm về KĐ giả thuyết TK”.
các tình huống khác với những tình huống quen thuộc mà SV đã được học:
5.2. THỰC NGHIỆM KIỂM CHỨNG GIẢ THUYẾT KHOA HỌC
Chúng tôi nhắc lại ở đây giả thuyết khoa học đã được rút ra khi phân tích quan
hệ thể chế R(IV, O) ở chương 4:
Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép giải
thích sai lầm của SV:
R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so
sánh hai trung bình thực nghiệm độc lập.
R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung
bình thực nghiệm độc lập.
5.2.1. Mô tả thực nghiệm
Chúng tôi phát cho SV đề bài (gồm hai bài toán). SV làm việc cá nhân để giải
hai bài toán này với thời gian 90 phút, sau đó chúng tôi thu lại bài làm để phân tích.
Bài toán 1: Kết quả XN nồng độ HbA1c (%) trên hai nhóm:
Nhóm 1: Gồm 27 bệnh nhân bị tiểu đường type 2:
6.4, 6.4, 5.4, 6.0, 6.2, 8.1, 1.6, 7.1, 7.4, 6.1, 7.2, 7.2, 6.6, 7.9, 6.5, 6.8, 8.4, 7.5, 6.6,
7.7, 5.9, 7.6, 7.3, 10.6, 6.6, 6.1, 5.6.
Nhóm 2: Gồm 27 người bình thường (không bị tiểu đường):
5.1, 5.3, 5.0, 5.5, 5.5, 5.7, 5.4, 5.6, 5.4, 5.1, 5.3, 6.2, 5.9, 5.1, 5.3, 5.8, 5.9, 6.0, 6.2,
5.3, 5.4, 5.0, 5.1, 5.3, 6.9, 5.9, 5.6.
Câu hỏi: Nồng độ HbA1c của những người bị tiểu đường (nhóm 1) có cao
hơn nồng độ này ở những người bình thường không (nhóm 2)? (α =0,05)
163
Bài toán 2: Một nghiên cứu nhằm so sánh nồng độ lysozyme giữa hai nhóm
bệnh nhân. Nhóm 1 gồm 29 bệnh nhân, nhóm 2 gồm 30 bệnh nhân tuổi từ 20 đến
60. Số liệu như sau: (Nguyễn Văn Tuấn, 2010)
Nhóm 1: 0.2, 0.3, 0.4, 1.1, 2.0, 2.1, 3.3, 3.8, 4.5, 4.8, 4.9, 5.0, 5.3, 7.5, 9.8,
10.4, 10.9, 11.3, 12.4, 16.2, 17.6, 18.9, 20.7, 24.0, 25.4, 40.0, 42.2, 50.0, 60.0.
Nhóm 2: 0.2, 0.3, 0.4, 0.7, 1.2, 1.5, 1.5, 1.9, 2.0, 2.4, 2.5, 2.8, 3.6, 4.8, 4.8, 5.4,
5.7, 5.8, 7.5, 8.7, 8.8, 9.1, 10.3, 15.6, 16.1, 16.5, 16.7, 20.0, 20.7, 33.0.
Câu hỏi: So sánh nồng độ Lysozyme trung bình trong hai nhóm trên (α
=0,05)
Cả hai bài toán được chúng tôi thiết kế ở đó các các dấu hiệu của tình huống
quen thuộc không còn được đảm bảo. Đây là các tình huống ngắt quãng hợp đồng
vì:
- DL mà chúng tôi đưa ra không có PPC.
- Phương sai hai mẫu không đồng nhất trong mỗi tình huống.
- Yêu cầu của bài toán 1 không còn thích hợp với phép kiểm hai đuôi, nó phù
hợp với phép kiểm một đuôi (Betty R. Kirkwood, 2003)
Để KĐ tính chuẩn của DL, phương pháp đơn giản nhất là vẽ biểu đồ tần số.
Nếu DL có PPC thì tần số cao nhất tập trung ở giữa và thấp dần về hai bên. Ngoài
ra, có thể dùng các phương pháp khác như: phép kiểm chi bình phương, phép kiểm
Kolmogorov-Smirnov khi cỡ mẫu n > 50, phép kiểm Shapiro-Wilk khi cỡ mẫu
n ≤ 50. (Nguyễn Ngọc Rạng, 2012)
Trong thể chế IV, KĐ tính chuẩn của DL là một bài toán độc lập và được thực
hiện bởi phép kiểm chi bình phương. Đây không phải là việc bắt buộc khi giải quyết
kiểu nhiệm vụ Ttb2, vì để thực hiện phép kiểm chi bình phương phải chia DL thành
từng lớp, dẫn đến sai số khi tính toán. Mặt khác, phép kiểm chi bình phương rất
phức tạp và mất nhiều thời gian tính toán nên nó đã bị bỏ qua trong các ví dụ và bài
tập của giáo trình V1.
5.2.2. Phân tích tiên nghiệm
5.2.2.1. Các chiến lược có thể
164
• S1: dùng phép kiểm t một đuôi mà không KĐ tính chuẩn của DL
−
+
−
(
(
1)
n 1
2 s 2
=
=
Đặt giả thuyết H0: µ1 = µ2; HA: µ1 > µ2
2 2 σ σ σ 2
2 1
2 s 1 +
n 2 − 2
1) n 1
n 2
−
2
x 1
x
=
t
n+
=
− ) 2 2
2 σ
+
1 n 1
1 n 2
n+
~ Student( 1 n
2α( 1 n
− ) 2 2
Miền bác bỏ H0 là t > C = t
• S2: dùng phép kiểm t một đuôi, có KĐ tính chuẩn của DL
- KĐ tính chuẩn của DL bằng phép kiểm chi bình phương, Shapiro-Wilk hoặc dựa
vào biểu đồ tần số;
- Thực hiện giống S1 nếu DL có PPC;
- Nếu DL không có PPC: Kết luận không thể so sánh hai trung bình bằng phép kiểm
t. Trong trường hợp này cần phải hoán chuyển DL về PPC hoặc sử dụng các phép
kiểm phi tham số.
• S3: dùng phép kiểm t hai đuôi mà không KĐ tính chuẩn của DL
1;
n+
- Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2 - Tính t như chiến lược S
− ) 2 2
- Miền bác bỏ H0 là | t | > C = tα ( 1 n
• S4: dùng phép kiểm t hai đuôi có KĐ tính chuẩn của DL
- KĐ tính chuẩn của DL bằng phép kiểm chi bình phương hoặc dựa vào biểu đồ tần
số.
- Thực hiện giống S3
5.2.2.2. Biến didactic
Những biến sau đây đã được chúng tôi tính đến khi xây dựng các bài toán
thực nghiệm:
• Biến V1: Cách đặt câu hỏi.
165
Cách đặt câu hỏi ở bài toán 1 phù hợp với phép kiểm một đuôi vì muốn đánh
giá xem nồng độ HbA1c trong nhóm 1 có cao hơn trong nhóm 2 hay không.
Còn trong bài toán 2, phép kiểm hai đuôi là phù hợp vì yêu cầu của bài toán là
đánh giá sự khác biệt về nồng độ lysozyme hay không của hai nhóm, không yêu cầu
trả lời nhóm này có cao hơn hoặc thấp hơn nhóm kia không.
• Biến V2: Bản chất của DL. Biến này có hai giá trị
- V2.1.: DL tuân theo PPC
- V2.2.: DL không tuân theo PPC
Trong cả hai bài toán, chúng tôi đều chọn biến V2.2: DL không tuân theo PPC.
Trong bài toán 1, dù SV có KĐ hay không KĐ tính chuẩn của DL thì kết quả
của tình huống vẫn đúng vì kết quả phép kiểm t phù hợp với kết quả của các phép
kiểm phi tham số (không cần điều kiện DL có PPC). Tuy nhiên, ở bài toán 2 nếu SV
không KĐ tính chuẩn của DL mà thực hiện ngay phép kiểm t sẽ cho ra kết luận sai.
Trong trường hợp này, SV phải thực hiện hoán chuyển DL để đưa DL về PPC hoặc
sử dụng phép kiểm phi tham số khi DL không tuân theo PPC. Các phép kiểm phi
tham số chỉ nên dùng khi không thể hoán chuyển được DL theo PPC vì nhược điểm
của các phép kiểm này là khả năng tìm ra sự khác biệt kém, không mạnh như các
phép kiểm có tham số.
Việc hoán chuyển DL về PPC hoặc sử dụng phép kiểm phi tham số không
được trình bày trong giáo trình V1 nên nếu DL không có PPC, SV sẽ hoặc là vẫn
thực hiện phép kiểm t như đã nói trên và cho kết luận sai hoặc là kết luận DL không
thỏa điều kiện của phép kiểm t nên không thể so sánh được hai trung bình.
3.1: Phương sai đã biết
• Biến V3: Phương sai dân số, có hai giá trị
3.2: Phương sai chưa biết
- V - V
Nếu phương sai đã biết thì dùng phép kiểm u, nếu phương sai chưa biết thì
dùng phép kiểm t để so sánh hai trung bình.
Trong cả hai bài toán này, chúng tôi đều chọn biến V3.2: Phương sai chưa biết.
166
5.2.3. Phân tích tiên nghiệm bài toán 1
Bài toán này được thiết kế để KĐ giả thuyết khoa học đã nêu. Chúng tôi chọn
biến V2.2.: DL không tuân theo PPC. Chúng tôi muốn biết SV có KĐ tính chuẩn của
DL hay không trước khi thực hiện phép kiểm t. Nếu SV không KĐ tính chuẩn mà
thực hiện ngay phép kiểm t sẽ cho phép khẳng định quy tắc R1 của giả thuyết 1.
Ngoài ra, để trả lời câu hỏi của bài toán 1 “Nồng độ HbA1c (%) của những người bị
tiểu đường có cao hơn nồng độ này ở những người bình thường không?”, phép
kiểm một đuôi là phù hợp. Nếu SV không chú ý đến điều này mà thực hiện phép
kiểm hai đuôi sẽ cho phép chúng tôi khẳng định quy tắc R2 của giả thuyết 1.
Các lời giải có thể quan sát được tương ứng với mỗi chiến lược
1X = 7,14; S1 = 1,379; n1 = 27 và
2X = 5,548; S2 = 0,444; n2 = 27
Các tham số thống kê như sau:
Lời giải tương ứng với chiến lược S1:
−
−
+
(
1)
(
n 1
2 s 2
=
=
Đặt giả thuyết: H0: µ1 = µ2; HA: µ1 > µ2
2 2 σ σ σ 2
2 1
2 s 1 +
n 2 − 2
1) n 1
n 2
−
x 2
=
t
= = 1,049
2 σ
+
1 n 1
1 n 2
x 1
Nếu H0 đúng thì = 5,71. Vì t > C = t0,1(52) = 1,695 nên bác bỏ
H0.
Kết luận: Nồng độ HbA1c của nhóm 1 cao hơn nhóm 2 có ý nghĩa.
Lời giải tương ứng với chiến lược S2:
- Dựa vào biểu đồ cột (hình 5.1 và hình 5.2) ta thấy DL không có hình dạng
PPC, DL bị lệch, cột cao nhất không tập trung ở giữa và thấp dần về hai bên.
Những thông tin này cho ta biết nồng độ HbA1c không tuân theo PPC vì thế
không thể dùng phép kiểm t để so sánh hai trung bình.
- Sử dụng phép kiểm Shapiro-Wilk để KĐ tính chuẩn của DL. Kết quả cho
thấy DL về nồng độ HbA1c của hai nhóm không có PPC (p < 0,05). Biểu đồ tần số
bị lệch về một phía (xem hình 5.1 và 5.2).
167
Hình 5.1. Biểu đồ nồng độ HbA1c, nhóm 1
Hình 5.2. Biểu đồ nồng độ HbA1c, nhóm 2
Vì DL của X1 và X2 đều không tuân theo PPC nên không thể dùng phép kiểm
t để so sánh hai trung bình. Trong trường hợp này có thể hoán chuyển DL về PPC
hoặc sử dụng phép kiểm phi tham số Wilcoxon bằng phần mềm R để KĐ giả thuyết
như sau:
H0: Không có sự khác biệt về nồng độ HbA1c trong hai nhóm trên;
H1: Nồng độ HbA1c trong nhóm 1 cao hơn nhóm 2.
168
wilcox.test(X1, X2)
Wilcoxon rank sum test with continuity correction
data: X1 and X2
W = 680.5, p-value = 4.623e-08
alternative hypothesis: true location shift is not equal to 0 Vì p < 0,05 nên có cơ sở để bác bỏ H 0
Kết luận: Nồng độ HbA1c trong nhóm 1 cao hơn nhóm 2
Cũng có thể SV vẫn KĐ tính chuẩn của DL bằng phép kiểm chi bình phương
1.
nhưng tính toán sai dẫn đến kết luận DL tuân theo PPC và tiếp tục dùng phép kiểm t một đuôi để so sánh hai trung bình như chiến lược S
Lời giải tương ứng với chiến lược S3:
−
−
+
(
1)
(
n 1
2 s 2
=
=
* Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2
2 2 σ σ σ 2
2 1
2 s 1 +
n 2 − 2
1) n 1
n 2
−
x 2
= = 1,049
=
t
A(52) = 2 nên bác bỏ HR0R.
A0,05A
+
2 σ
1 n 1
1 n 2
x 1
A E = 5,71. Vì |t| > C = tE Nếu H0 đúng thì
1X > 2X .
Kết luận: Nồng độ HbA1c của nhóm 1 cao hơn nhóm 2 do
Lời giải tương ứng với chiến lược SR4R:
- KĐ tính chuẩn của DL như chiến lược SR2 Rvà kết luận DL không tuân theo PPC
nên không thể so sánh hai trung bình trong trường hợp này.
- Cũng có thể, SV KĐ tính chuẩn của DL bằng phép kiểm chi bình phương
nhưng tính toán sai nên kết luận DL có PPC và thực hiện tiếp phép kiểm t hai đuôi
3E
như chiến lược SA
* Nhận xét về các chiến lược trong bài toán 1:
Chúng tôi dự đoán, chiến lược SR3R xảy ra nhiều nhất. Các chiến lược còn lại
không hoặc ít xảy ra vì khi phân tích R(IRVR, O) cũng như việc triển khai các tổ chức
toán học trên lớp không có kiểu nhiệm vụ KĐ tính chuẩn của DL trước khi thực
169
hiện phép kiểm t để so sánh hai trung bình, phép kiểm một đuôi cũng ít có cơ hội
xuất hiện trong thể chế IRV
5.2.4. Phân tích tiên nghiệm bài toán 2
Bài toán này cũng được thiết kế để kiểm chứng tính đúng đắn của giả thuyết
nghiên cứu đã nêu. Trong bài toán này, chúng tôi chọn biến VR2.2.R: DL không có
PPC. Do đó, nếu SV không KĐ tính chuẩn của DL mà thực hiện ngay phép kiểm t
sẽ cho ra kết luận sai. Chúng tôi dự đoán sai lầm này rất dễ xảy ra vì đây là bài toán
quen thuộc với SV, nó tương tự các ví dụ và bài tập về kiểu nhiệm vụ TRtb2R trong
giáo trình V1 mà ở đó chúng tôi không tìm thấy kiểu nhiệm vụ KĐ tính chuẩn của
DL trước khi thực hiện phép kiểm t. Việc KĐ tính chuẩn của DL xuất hiện trong bài
toán về những ứng dụng của phép kiểm chi bình phương, nó tồn tại độc lập, không
có liên hệ đến phép kiểm t.
Đây là bài toán KĐ hai đuôi và phép kiểm phù hợp nhất là phép kiểm t hai
đuôi. Cách đặt câu hỏi của bài toán tạo điều kiện cho sự xuất hiện của các chiến
lược SR3R và SR4R.
Các lời giải có thể quan sát tương ứng với mỗi chiến lược
Bài toán này phù hợp với phép kiểm hai đuôi vì chỉ yêu cầu so sánh có sự
khác biệt hay không về nồng độ lysozyme giữa hai nhóm bệnh nhân, không yêu cầu
so sánh nhóm này cao hơn hoặc thấp hơn nhóm kia nên chúng tôi dự đoán chỉ xuất
hiện chiến lược SR3R và S R4R.
=
=
=
=
=
=
=
=
30;
X
7,683;
61,62;
7,849
29;
X
14,31;
247,766;
15,74
n 2
2
2 s 2
s 2
n 1
1
2 s 1
s 1
* Lời giải tương ứng với chiến lược SR3
−
−
+
(
1)
(
n 1
2 s 2
=
=
Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2
2 2 σ σ σ 2
2 1
2 s 1 +
n 2 − 2
1) n 1
n 2
−
x 2
= =153,05
=
t
A0,05E(57) = 2,01 nên bác bỏ
+
2 σ
1 n 1
1 n 2
x 1
A = 2,056. Vì |t| > C = tE Nếu H0 đúng thì
H0. Kết luận: Nồng độ Lysozyme của hai nhóm khác nhau có ý nghĩa.
170
Nhận xét: Lời giải này sai do DL không có PPC.
* Lời giải tương ứng với chiến lược S4
1 và X
2 phép kiểm Shapiro-Wilk có p < 0,05, biểu đồ
- KĐ tính chuẩn của X
nồng độ lysozyme bị lệch về phía trái (hình 5.3 và hình 5.4) nên có thể kết luận DL
không có PPC.
Hình 5.3. Biểu đồ nồng độ lysozyme nhóm 1
Hình 5.4. Biểu đồ nồng độ lysozyme nhóm 2
171
Hình 5.5. DL hoán chuyển Y1 = ln(X1)
Hình 5.6. DL hoán chuyển Y2 = ln(X2)
Khi DL không tuân theo PPC, ta có hai cách sau:
Cách 1: Hoán chuyển DL sang logarith (cơ số e): Y1 = ln(X1) và Y2 = ln(X2)
KĐ tính chuẩn của DL sau khi hoán chuyển có kết quả như sau:
shapiro.test(Y1)
Shapiro-Wilk normality test
data: Y1
W = 0.938, p-value = 0.08868
shapiro.test(Y2)
Shapiro-Wilk normality test
172
data: Y2
W = 0.9555, p-value = 0.2372
Kết quả KĐ cho thấy, p > 0,05 nên có thể kết luận DL sau khi hoán chuyển có
PPC (hình 5.5 và hình 5.6)
Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2
Khi đó, giá trị của t là 1,406, với kết quả này ta chưa đủ cơ sở để bác bỏ H0, tức là
nồng độ lysozyme ở hai nhóm khác nhau không ý nghĩa.
Cách 2: Dùng KĐ phi tham số Wilcoxon
Giả thuyết KĐ: H0: Nồng độ lysozyme ở hai nhóm khác nhau không ý nghĩa.
Wilcoxon rank sum test with continuity correction
data: X1 and X2
W = 541, p-value = 0.1096
alternative hypothesis: true location shift is not equal to 0
Vì p > 0,05 nên chưa đủ cơ sở để bác bỏ H0.
Kết luận: Nồng độ lysozyme ở hai nhóm khác nhau không ý nghĩa.
- Có thể SV dùng phép kiểm chi bình phương để KĐ tính chuẩn của DL nhưng
3.
tính toán sai dẫn đến kết luận DL có PPC và tiếp tục dùng phép kiểm t để so sánh hai trung bình như chiến lược S
Nhận xét Qua phân tích chương trình và giáo trình chúng tôi có thể dự đoán
trong bài toán 2, chỉ có chiến lược S3 xuất hiện. Có rất ít (hoặc không có) chiến
lược S4 vì các ví dụ và bài tập trong giáo trình V1 không yêu cầu SV phải KĐ tính
chuẩn của DL trước khi thực hiện phép kiểm t mặc dù điều kiện DL có PPC được
trình bày trong giáo trình V1 ở phần lí thuyết phép kiểm t.
Kết quả của chiến lược S3 hoàn toàn khác với câu trả lời mong đợi vì SV
không KĐ tính chuẩn của DL trước khi thực hiện phép kiểm t.
5.2.5. Phân tích hậu nghiệm
Thực hiện tiến hành trên 349 SV năm thứ hai ngành Bác sĩ đa khoa (6 năm) và
ngành Dược (5 năm) sau khi vừa học xong chương “Kiểm định giả thuyết thống kê”
Bảng 5.1 là kết quả TK các bài toán trong thực nghiệm:
173
Bảng 5.1. Kết quả TK các chiến lược được sử dụng
Bài toán Tổng số
3 S 4
1 S S
Chiến lược 2 S
1 0 0 349 0 349
2 0 0 349 0 349
Kết quả thực nghiệm này cho thấy 349/349 (100%) SV sử dụng chiến lược S3:
Sử dụng phép kiểm t hai đuôi không KĐ tính chuẩn của DL. Không có SV nào chú
ý đến điều kiện DL phải có PPC trong cả hai bài toán. Hơn nữa, trong bài toán 1,
mặc dù phép kiểm t một đuôi là phù hợp nhưng cũng không có SV nào thực hiện
phép kiểm t một đuôi. (Một số bài giải của SV có trong Phụ lục 4)
Kết quả thực nghiệm đã cho phép kiểm chứng giả thuyết khoa học
(giả thuyết 1) đã nêu.
5.3. KẾT LUẬN CHƯƠNG 5
Trong chương này chúng tôi đã tiến hành hai thực nghiệm trên hai đối tượng
GV và SV. Thực nghiệm thứ nhất: phân tích thực hành DH của GV qua việc phân
tích cấu trúc của tổ chức toán học được xây dựng trong lớp học và sự liên hệ của
các tổ chức toán học, phân tích các tổ chức didactic mà GV đã triển khai để truyền
bá các tổ chức toán học thông qua 6 thời điểm nghiên cứu.
Kết quả phân tích thực nghiệm thứ nhất cho thấy, liên quan đến kiểu nhiệm vụ
t
Ttb2 còn tồn tại một tổ chức toán học không đầy đủ về mặt kỹ thuật mà GV đã triển
tbτ đo GV đưa vào
2 2
khai trên lớp học. Sự thiếu hụt này thể hiện ở chỗ: kỹ thuật
không bao hàm việc KĐ tính đồng nhất của phương sai và tính chuẩn của DL - điều
kiện tiên quyết của phép kiểm t. Kết quả này cũng phù hợp với kết quả phân tích
quan hệ thể chế R(IV, O) mà chúng tôi đã thực hiện trong chương 4.
Ở thực nghiệm thứ hai, trên đối tượng SV, chúng tôi cũng đã kiểm chứng tính
đúng đắn của giả thuyết khoa học:
174
Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép
giải thích sai lầm của SV:
R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so
sánh hai trung bình thực nghiệm độc lập.
R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung
bình thực nghiệm độc lập.
Để làm đầy tổ chức toán học nói trên và kiểm chứng giả thuyết khoa học (giả
thuyết 1) trên một đối tượng SV khác, chúng tôi sẽ xây dựng một đồ án DH và triển
khai trên lớp học. Đây cũng là nội dung mà chúng tôi sẽ thực hiện ở chương 6.
175
CHƯƠNG 6
CÁC GIẢI PHÁP SƯ PHẠM VÀ NGHIÊN CỨU THỰC NGHIỆM
A. GIẢI PHÁP SƯ PHẠM
6.1. CƠ SỞ ĐỀ XUẤT GIẢI PHÁP
6.1.1. Cơ sở lí luận
Các giải pháp sư phạm được đề xuất trước hết dựa trên xu hướng tích cực hóa
hoạt động học tập của người học. Xu hướng này được hình thành từ Thuyết kiến
tạo, theo đó:
tri thức được tạo nên một cách tích cực bởi chủ thể nhận thức chứ không -
phải tiếp thu thụ động từ bên ngoài.
- nhận thức là quá trình thích nghi và tổ chức lại thế giới quan của mỗi người
thông qua các hoạt động đồng hóa và điều ứng những tri thức và kinh
nghiệm sẵn có của mình để thích nghi với môi trường.
- việc học xẩy ra trong hoạt động và thông qua hoạt động.
Những gì trình bày ở Chương 1 của luận án cho thấy Didactic và Thuyết kiến
tạo đều có chung quan điểm này về việc học. Theo quan điểm ấy, việc học chỉ xẩy
ra khi người học chủ động, còn người dạy tạo được môi trường sao cho tri thức cần
dạy mang lại một giải pháp tối ưu.
Một cơ sở lý luận khác là khái niệm mô hình hóa (toán học) và vai trò của nó
trong việc xây dựng nghĩa của tri thức.
Ngoài ra, cơ sở để đề ra các giải pháp còn là những kết quả nghiên cứu mà
chúng tôi đã trình bày ở các chương trước. Cụ thể là :
6.1.2. Kết quả phân tích tri thức luận
- Vai trò của XS – TK trong các nghiên cứu y học, trong chẩn bệnh và
điều trị.
- Vai trò của PPC trong KĐ giả thuyết TK.
- Các kỹ thuật cần biết để giải bài toán KĐ nói chung, bài toán KĐ giả
thuyết về so sánh hai trung bình thực nghiệm độc lập nói riêng.
176
6.1.3. Kết quả phân tích quan hệ thể chế, quan hệ cá nhân
- Sự thiếu hụt kỹ thuật KĐ giả thuyết TK về so sánh hai trung bình thực
nghiệm độc lập, sự vắng mặt đối thuyết « một đuôi » (µ < µ’ hoặc µ > µ’)
để giải quyết nhiều vấn đề thực tiễn.
- Sai lầm của SV sinh ra từ những lựa chọn của thể chế.
6.2. CÁC GIẢI PHÁP SƯ PHẠM
6.2.1. Giải pháp 1: Cấu trúc lại chương trình đào tạo của các trường đại học Y
Như chúng tôi đã trình bày trong phần mở đầu của luận án, môn học XS-TK ở
các trường đại học y dược được đưa vào giảng dạy ngay từ học kì I của năm thứ
nhất. Ở năm học này SV y khoa chưa có nhiều kiến thức về y học nên GV khó có
thể truyền đạt những ứng dụng của XS-TK đến SV, phục vụ cho mục đích nghiên
cứu y học và ứng dụng cho nghề nghệp của họ sau khi tốt nghiệp. Mặt khác, ở nước
ta chưa có sự kết hợp giữa người làm TK và người sử dụng TK: nhà TK học sử
dụng TK cho sự phát triển nội tại của khoa học TK, người sử dụng TK làm việc độc
lập trong việc ứng dụng các công cụ của XS-TK trong nghiên cứu y học. Điều này
dẫn đến các nghiên cứu của TK học chưa có tính thực tiễn trong khi các nghiên cứu
có tính thực tiễn như nghiên cứu y học thì vẫn còn có những sai sót không đáng có.
Để khắc phục nhược điểm này chúng tôi đề nghị:
Nhà thiết kế chương trình cần thiết kế lại khung chương trình XS-TK để đưa
vào giảng dạy khi SV đã có một số kiến thức về y, dược học. Chẳng hạn, môn học
XS – TK có thể dạy ở học kì II của năm thứ năm cho hệ đào tạo 6 năm, năm thứ ba
cho hệ đào tạo 4 năm. Vào năm cuối, SV sẽ phải tiến hành các nghiên cứu nhỏ, viết
các báo cáo khoa học, viết luận văn tốt nghiệp. Và điều quan trọng là kiến thức Y –
Dược học đã có sẽ là môi trường cho phép loại bỏ những chiến lược sai mà SV
phạm phải.
6.2.2. Giải pháp 2: Khai thác kết quả phân tích tri thức luận để tổ chức lại các kiến
thức trong chương trình và giáo trình
Chương trình, giáo trình phải làm cho SV thấy rõ vai trò của XS – TK trong
chẩn bệnh và điều trị, phải coi trọng hơn nhiệm vụ bồi dưỡng năng lực nghiên cứu,
177
khả năng đọc hiểu và biết phê phán các công trình thuộc lĩnh vực Y – Dược học. Về
điều này, phân tích của chúng tôi cho thấy các thể chế IF, IA đặc biệt quan tâm.
Các loại đối thuyết, các phép kiểm một đuôi, các điều kiện thực hiện mỗi phép
kiểm, các bước của mỗi kỹ thuật, … phải được giới thiệu đầy đủ cho SV.
6.2.3. Giải pháp 3: Khai thác công nghệ thông tin vào việc học XS - TK
Cần dạy cho SV một số phần mềm như SPSS, R, Epi Info, ... Các phần mềm
này mang lại những công cụ hiệu quả để phân tích TK, xử lí được những bộ DL cỡ
lớn, chuẩn hóa DL khi nó chưa có PPC, v.v....
6.2.4. Giải pháp 4: Thiết kế một website như một bệnh viện ảo
SV có thể thực hiện tất cả các khâu của một quá trình nghiên cứu y học, từ thu
thập DL, phân tích TK, kết luận, viết bài báo. Bệnh viện ảo này là một bước thử
nghiệm nhằm khắc phục những khó khăn khi SV tiếp cận với bệnh viện thật hoặc
phải làm việc trên những bộ DL giả định mà những bộ DL này ít nhiều có tính chủ
quan của người viết giáo trình nhằm minh họa cho các kiến thức được giảng dạy
trong chương trình chứ chưa có tính thực tiễn.
6.2.5. Giải pháp 5: Xây dựng các tình huống học tập trong đó tồn tại một môi
trường để hoạt động đồng hóa và điều tiết của SV xẩy ra
Các hoạt động đồng hóa và điều tiết này có thể gắn liền với quá trình mô hình
hóa toán học. Môi trường phải cho phép SV loại bỏ hay hợp thức hóa những chiến
lược giải quyết vấn đề, những kiến thức cần SV thu nhận được.
Đồ án DH mà chúng tôi xây dựng dưới đây là một ví dụ minh họa cho các giải
pháp đã đề xuất.
B. THỰC NGHIỆM
Trong phần này chúng tôi sẽ thiết kế một đồ án DH minh họa cho những giải
pháp đã đề xuất. Tri thức cần dạy ở đây là các phương pháp KĐ giả thuyết về so
sánh hai trung bình. Mục đích của đồ án là tạo môi trường cho SV nhận ra sai lầm
và từ đó làm đầy hơn các tổ chức toán học liên quan đến kiểu nhiệm vụ so sánh hai
trung bình thực nghiệm độc lập. Tuy nhiên, yếu tố môi trường cho phép nhận ra sai
178
lầm trong đồ án của chúng tôi không phải tự nó có, mà phải do các pha trong đồ án
tạo ra. Lý do của sự lựa chọn này nằm ở chỗ SV tham gia thực nghiệm là SV năm
thứ nhất của Đại học Y dược Tp HCM – họ chưa có những kiến thức y học cần thiết
để nhận ra sai lầm của mình.
Như chúng tôi đã nêu trong Chương 1, việc nghiên cứu một đồ án DH gồm
các pha:
- Nghiên cứu tri thức cần dạy qua các phân tích tri thức luận và phân tích
thể chế
- Xây dựng đồ án: xác định vấn đề sẽ đưa ra cho người học nghiên cứu, dàn
dựng kịch bản, phân tích tiên nghiệm và xác định DL cần thu thập, hiện
tượng cần quan sát.
- Triển khai đồ án trong lớp học, tổ chức quan sát trên lớp học
- Phân tích hậu nghiệm để xem có hợp thức hóa (nội tại) được hay không
những gì đã dự kiến khi xây dựng đồ án.
6.3. NHỮNG KẾT QUẢ CHỦ YẾU RÚT RA TỪ PHÂN TÍCH TRI THỨC
LUẬN VỀ KĐ GIẢ THUYẾT TK
Đối tượng tri thức được quan tâm ở đây là phép kiểm t - phép KĐ giả thuyết
liên quan đến việc so sánh hai số trung bình thực nghiệm độc lập. Vấn đề so sánh
này có mặt thường xuyên trong các nghiên cứu y học.
Trong các nghiên cứu này người ta thường phải KĐ một trong hai loại giả
thuyết sau:
- Sự khác biệt giữa hai số trung bình là không có ý nghĩa
- Số trung bình này lớn hơn số trung bình kia
Đối với trường hợp thứ nhất người ta dùng phép kiểm hai đuôi. Trong trường
hợp thứ hai, phép kiểm một đuôi là cần thiết.
Nghiên cứu tri thức luận của chúng tôi còn chỉ ra rằng PPC là một công cụ
trung tâm của các phân tích TK. Tính chuẩn của DL là điều kiện cần để giải quyết
các bài toán KĐ giả thuyết TK một cách thỏa đáng, nếu không thì kết quả nhận
được không đáng tin cậy.
179
Như vậy, việc kiểm tra tính chuẩn của DL là một bước quan trọng trong kỹ
thuật giải quyết kiểu nhiệm vụ Ttb2: so sánh hai trung bình thực nghiệm độc lập.
Thế nhưng, trong thể chế IV mà chúng tôi quan tâm - thể chế DH XS-TK ở
trường Đại học Y Dược Tp HCM, tổ chức toán học xây dựng quanh kiểu nhiệm vụ
t
Ttb2 lại có những thiếu hụt về kỹ thuật. Sự thiếu hụt đó thể hiện ở hai điểm. Thứ
tbτ được đưa vào trong thể chế không bao gồm việc kiểm tra hai
2 2
nhất, kỹ thuật
điều kiện sau của phép kiểm t :
- phương sai đồng nhất
- DL có PPC.
t
Thứ hai, loại giả thuyết « số trung bình này lớn hơn số trung bình kia » không được
tbτ sử dụng phép kiểm một đuôi không được đưa
1 2
đề cập đến. Cụ thể hơn, kỹ thuật
vào, dù nó rất cần thiết cho việc giải quyết Ttb2.
Phân tích thể chế đã dẫn chúng tôi tới giả thuyết khoa học (giả thuyết 1) cho
phép giải thích những sai lầm mà SV phạm phải khi đối diện với Ttb2.
Một đồ án đã được xây dựng và triển khai để bổ sung cho quan hệ thể chế và
tác động vào quan hệ cá nhân của SV đối với bài toán KĐ giả thuyết TK.
6.4. XÂY DỰNG ĐỒ ÁN
Với mục đích khắc phục những khiếm khuyết về kỹ thuật của tổ chức toán học
liên quan đến Ttb2 đã được xây dựng trong thể chế IV và kiểm chứng các giả thuyết
khoa học đã đặt ra, chúng tôi thiết kế một đồ án DH kiểm định giả thuyết thống kê.
Phân tích trên đã dẫn chúng tôi đến việc chọn PPC và phép kiểm một đuôi làm đối
tượng làm việc trong đồ án này.
6.4.1. Các bài toán cơ sở của đồ án
Đồ án được xây dựng trên cơ sở hai bài toán sau (phiếu số 1 trong Phụ lục 7):
Bài toán 1: Lượng PSA (X1 ng/ml) của một mẫu 44 người bị ung thư tiền liệt tuyến
có di căn như sau:
6.0, 7.3, 8.5, 8.9, 9.5, 11.9, 10.2, 11.3, 11.5, 11.4, 11.2, 12.5, 12.9, 13.0, 14.0, 13.8,
12.9, 14.8, 15.0, 15.5, 15.8, 15.7, 16.0, 15.0, 16.0, 16.2, 17.1, 18.0, 17.8, 16.9, 16.5,
17.4, 17.9, 18.5, 19.4, 19.6, 18.7, 18.3, 21.0, 22.5, 26.0, 29.1, 25.6, 25.8
180
2 ng/ml) của 27 người bị ung thư tiền liệt tuyến chưa di căn như sau:
Lượng PSA (X
8, 9, 9.1, 9.2, 9.5, 9.8, 10.7, 10.8, 11.2, 11.7, 11.8, 12.3, 12.5, 12.9, 13, 14, 14.5,
14.7, 15.5, 16, 16.4, 16.9, 17, 18, 19.1, 21, 21.8
Hỏi: Lượng PSA của người ung thư tiền liệt tuyến có di căn có cao hơn lượng
PSA của người ung thư tiền liệt tuyến chưa di căn không? (α = 0,05)
Bài toán 2: Nồng độ HbA1c của 28 người bị đái tháo đường type 2 :
12.2, 8.2, 5.9, 6.1, 8.3, 9.5, 6.3, 9.3, 7.5, 6.6, 7.8, 6.3, 7.7, 7.3, 6.5, 5.5, 6, 14.9, 7.5,
8.3, 7.4, 8.8, 12, 7.9, 10.9, 6.1, 5.1, 7.8
Nồng độ HbA1c của 30 người bình thường (không bị đái tháo đường) :
8.1, 5.3, 5.0, 5.8, 9.5, 5.4, 10.0, 4.5, 8.8, 5.9, 6.2, 10.3, 7.1, 7.5, 9.2, 4.3, 8.8, 7.1,
6.4, 7.5, 7.3, 4.3, 10.1, 6.7, 9.3, 4.8, 5.8, 7.3, 8.2, 4.9
Hỏi: Nồng độ HbA1c của người bị đái tháo đường type 2 có cao hơn nồng độ
này ở người bình thường không? (α = 0,05).
6.4.2. Dàn dựng kịch bản
Đồ án được cấu tạo từ hai buổi học với đối tượng SV năm thứ nhất khi vừa
học xong chương KĐ giả thuyết TK.
Buổi 1: nhằm mục đích kiểm chứng lại giả thuyết khoa học thứ nhất với đối tượng
SV khác (hệ cử nhân - 4 năm).
SV làm việc cá nhân tại lớp trong 60 phút. Nhiệm vụ của họ là giải hai bài toán 1 và
2. Cả hai bài toán đều thuộc kiểu nhiệm vụ Ttb2 - so sánh hai trung bình thực
t
nghiệm độc lập. Đây là một kiểu nhiệm vụ quen thuộc đối với SV. Tuy nhiên, như
tbτ mà thể chế đưa vào chỉ cho câu trả lời đúng khi phương sai
2 2
đã nói, kỹ thuật
t
đồng nhất và DL có PPC, điều luôn luôn thỏa mãn trong tất cả những bài tập SV đã
tbτ thực hiện phép kiểm một đuôi
1 2
gặp. Hơn thế, trong những bài tập ấy, kỹ thuật
không
can thiệp.
181
Với hai bài toán 1 và 2, chúng tôi đã đặt SV vào trong tình huống phá vỡ hợp
đồng. Nếu SV bị chi phối bởi giả thuyết 1 thì họ sẽ cho câu trả lời sai, không phù
hợp với kiến thức y học.
Buổi 2: nhằm mục đích làm đầy cho tổ chức toán học liên quan đến Ttb2 đã
được xây dựng trong thể chế và kiểm chứng Giả thuyết 2: SV có thể nhận ra sai
lầm của mình thông qua hoạt động giải quyết các tình huống phá vỡ hợp đồng,
được thiết kế theo quan điểm của phương pháp DH tích cực, trong đó yếu tố môi
trường cho phép họ bác bỏ sự vận dụng một kỹ thuật ở ngoài phạm vi hợp thức
của nó.
Để tạo môi trường cho SV đặt ra câu hỏi về tính thỏa đáng của câu trả lời họ
đã đưa ra, chúng tôi sẽ cung cấp bài giảng của bác sĩ thông qua đoạn video và phiếu
thông tin y học. Vấn đề tìm nguyên nhân nảy sinh và những khiếm khuyết của kỹ
thuật đã biết sẽ được khắc phục.
Buổi học thứ hai này được thiết kế qua ba tình huống.
Tình huống 1 (75 phút) : Nghiên cứu bệnh đái tháo đường (bài toán 2)
Mục đích: Làm cho SV nhận ra sự cần thiết của hai điều kiện của phép kiểm t
và cung cấp thêm công cụ để kiểm định tính chuẩn của DL.
Tình huống 2 (55 phút) : Nghiên cứu bệnh ung thư tiền liệt tuyến (bài toán 1)
Mục đích: Giúp SV nhận ra sự cần thiết của phép kiểm một đuôi.
Tình huống 3 (40 phút) : Trở lại bài toán 2 (DL không có PPC)
Mục đích: Giải bài toán khi DL không có PPC và cung cấp kỹ thuật hoán
chuyển DL khi nó không có PPC.
6.4.3. Phân tích tiên nghiệm bài toán 1 và 2
6.4.3.1. Những chiến lược có thể
• S1: dùng phép kiểm t một đuôi không KĐ tính chuẩn của DL
• S2: dùng phép kiểm t một đuôi có KĐ tính chuẩn của DL
• S3: dùng phép kiểm t hai đuôi không KĐ tính chuẩn của DL
• S4: dùng phép kiểm t hai đuôi có KĐ tính chuẩn của DL
182
Đối với bài toán 1: DL đã cho có PPC và phương sai hai dân số đồng nhất nên
thỏa mãn điều kiện của phép kiểm t. Do đó SV có thực hiện hay không việc KĐ tính
chuẩn của DL thì đều không ảnh hưởng đến kết luận của bài toán. Tuy nhiên, với
A ta có thể dùng yếu tố Bayes (Sellke T., et al, 2001)
DL thu thập được và để trả lời câu hỏi trong cả hai bài toán thì phép kiểm một đuôi là câu trả lời đúng (chiến lược S2). Để đánh giá mức độ khả dĩ của hai giả thuyết H 0 và H
Đối với bài toán 2: DL không có PPC nên nếu SV không thực hiện KĐ tính
chuẩn của DL thì sẽ dẫn đến kết luận sai.
Do đó có thể khẳng định rằng chiến lược cho câu trả lời đúng ở hai bài toán
này là S2.
6.4.3.2. Biến didactic
• Biến V1: Cách đặt câu hỏi. Biến này có hai giá trị :
V1.1: Trung bình của hai nhóm có khác nhau không?
V1.2: Trung bình của nhóm 1 có cao hơn nhóm 2 không?
Chúng tôi muốn biết SV lựa chọn phép kiểm một đuôi hay hai đuôi để kiểm định
quy tắc R2 nên chọn biến V1.2 ở cả hai bài toán trong thực nghiệm này.
• Biến V2: Bản chất của DL. Biến này có hai giá trị
- V2.1: DL tuân theo PPC
- V2.2: DL không tuân theo PPC
Chúng tôi đã chọn giá trị V2.1 cho bài toán 1 và V2.2 cho bài toán 2.
Biến V3: Phương sai mẫu, có hai giá trị
V3.1: Phương sai hai mẫu không đồng nhất
V3.2 : Phương sai hai mẫu đồng nhất
Vì mục đích thực nghiệm chỉ liên quan đến PPC và phép kiểm một đuôi nên để đơn
giản hóa tình huống chúng tôi đã chọn giá trị V3.2 cho cả hai bài toán.
6.5. PHÂN TÍCH HẬU NGHIỆM
Buổi 1:
183
Chúng tôi phát cho SV phiếu số 1 (đề bài của hai bài toán, có trong Phụ lục 7),
SV làm việc cá nhân tại lớp trong 60 phút để giải hai bài toán KĐ giả thuyết TK.
Kết quả thu được trong bảng 6.1
184
Bảng 6.1. Kết quả thực nghiệm bài toán 1 và 2
Bài toán Chiến lược Tổng số
S1 S2 S3 S4
0 0 90 0 1 90
0 0 90 0 2 90
Kết quả thực nghiệm này cho thấy 90/90 (100%) SV sử dụng chiến lược S3:
dùng phép kiểm t hai đuôi không KĐ tính chuẩn của DL trong cả hai bài toán.
Ở bài toán 1, SV thực hiện KĐ giả thuyết và dẫn đến bác bỏ giả thuyết H0.
0 thì chỉ có thể kết luận "có sự khác biệt về nồng độ PSA ở hai nhóm"
Khi bác bỏ H
nhưng SV vẫn kết luận "lượng PSA của người bị ung thư tiền liệt tuyến di căn cao
hơn ở người chưa di căn" đúng như câu hỏi của bài toán 1.
Trong bài toán 2, SV sử dụng chiến lược S3 đã dẫn đến kết luận "lượng
HbA1c ở người đái tháo đường và ở người bình thường bằng nhau". Kết luận này
sai so với kết luận của bác sĩ trong video clip được chiếu trong giờ học "lượng
HbA1c ở người đái tháo đường cao hơn so với người bình thường".
Một số bài làm của SV có trong Phụ lục 4, biên bản buổi học được trình bày
trong Phụ lục 5.
Kết quả thu được ở đây một lần nữa cho phép chúng tôi khẳng định tình thỏa
đáng của giả thuyết khoa học thứ nhất về sự tồn tại của hai quy tắc R1, R2 (đã được
kiểm chứng trong nghiên cứu thực nghiệm trình bày ở chương 5)
Buổi 2
6.5.1. Tình huống 1 : nghiên cứu bệnh đái tháo đường
Pha 1A:
- GV thông báo kết quả TK về câu trả lời cho bài toán 2 mà SV đã làm việc trong
buổi 1: trong số SV tính toán đúng thì 100% đều kết luận “Không có sự khác biệt về
nồng độ HbA1c của người đái tháo đường và người bình thường”.
t
- GV gọi một một SV lên trình bày lại các bước của bài toán đã giải, SV này viết
tbτ gồm 3 bước đã được học
2 2
trên bảng lời giải của bài toán theo đúng kỹ thuật
thông qua các ví dụ của giáo trình V1 sử dụng trong thể chế IV.
185
Lời giải của mọi SV tham gia thực nghiệm đều tương tự.
- GV chiếu đoạn video bài giảng về bệnh đái tháo đường do bác sĩ Lê Thanh Toàn
trình bày. SV chăm chú theo dõi và ghi lại những thông tin liên quan đến bệnh đái
tháo đường như:
Ở người bị đái tháo đường được chẩn đoán nhưng chưa điều trị thì nồng độ
HbA1c lớn hơn rất nhiều so với người bình thường.
Ở người bị bệnh đái tháo đường đã được điều trị thì nồng độ HbA1c sẽ trở về
mức bình thường hoặc gần như bình thường.
Pha 1B: Thảo luận về sự khác biệt giữa lời giải của bài toán và kết luận của bác sĩ.
SV làm việc theo nhớm hai người, mỗi nhóm có một máy vi tính đã được đánh
số thứ tự. Những gì họ thảo luận đều được ghi âm và sau đó được chúng tôi tái lập
lại thành biên bản cho từng nhóm. Những trích dẫn in nghiêng trong phân tích dưới
đây đều lấy ra từ các biên bản.
SV dễ dàng tìm ra sự mâu thuẫn giữa câu trả lời mà họ đã đưa ra cho bài toán 2 và
kiến thức y học thu được từ bài giảng này.
Máy 29:
- Mình trả lời là nó không khác nhau mà ở đây thì khác nhau.
- Cái này nó cao bất thường chăng?
- Theo bác sĩ thì nó khác nhau. Nguyên nhân khác nhau tại đâu?
Pha 1C: Tìm nguyên nhân sai lầm
Đầu tiên, SV xem lại các bước giải trong bài toán 2 và đi đến kết luận là đã
tính toán đúng, các bước không có gì sai:
Máy 29:
- Sai ở đâu, các bước mình tính đâu có gì sai đâu?
Máy 7:
- Bài giải thì đúng rồi, các bước đều đúng.
Sau khi kiểm tra lại các bước, SV cho rằng nguyên nhân của sai sót là : do mẫu nhỏ,
do chọn mẫu không ngẫu nhiên.
Máy 7:
186
- Có thể người ta chọn theo ý thích
- Chấp nhận giả thuyết không có nghĩa là giả thuyết đó đúng, phải tăng cỡ mẫu
lên để KĐ lại.
Có nhóm nghĩ đến điều kiện của phép kiểm t nhưng không nhớ rõ nên họ mở
giáo trình ra xem lại.
Máy 7:
- Điều kiện của phép kiểm t đó, nhớ không?
- Có điều kiện gì?
GV phân tích những ý kiến mà SV đưa ra:
- Cỡ mẫu cũng là yếu tố quan trọng trong nghiên cứu, nhưng ở đây ta chỉ có
mẫu DL này nên ta bỏ qua vấn đề cỡ mẫu.
- Các mẫu cũng được lấy một cách ngẫu nhiên theo tiêu chuẩn nghiên cứu và
lấy trong hai quần thể độc lập: người bị bệnh đái tháo đường và người bình
thường.
- Về vấn đề mức sai lầm α, theo các quy ước trong nghiên cứu y học, người ta
vẫn lấy mức α = 5% nên trong bài toán này, ta cũng thực hiện theo quy ước
đó.
Sau khi GV phân tích, SV tiếp tục thảo luận để tìm nguyên nhân. Nhiều nhóm
đưa ra các nguyên nhân khác, đúng với mong đợi của chúng tôi.
Máy 29:
- KĐ sự đồng nhất của phương sai đi
- Cả hai bài này hôm bữa mình làm hết rồi, phương sai đồng nhất rồi, đâu cần
làm nữa.
- Vậy nguyên nhân ở đâu?
- Nó có PPC không, chắc là do nguyên nhân này.
Máy 31:
- Các bài toán trong sách, DL xem như có PPC, còn ở đây chưa biết có PPC
hay không nên có sự khác biệt giữa kết luận của bác sĩ và bài giải.
- Giờ mình xem DL có PPC không.
187
Như vậy, SV đã nhận ra hai điều kiện cần thiết của phép kiểm t - DL có PPC
và phương sai đồng nhất.
Pha 1D : Kiểm tra hai điều kiện của phép kiểm t
GV đặt câu hỏi: “Sử dụng kỹ thuật nào để kiểm tra các điều kiện này?”. Hầu
hết các nhóm đều trả lời: Sử dụng phép kiểm F để KĐ tính đồng nhất của phương
sai và sử dụng phép kiểm chi bình phương để KĐ tính chuẩn của DL.
Máy 29:
Cái này sử dụng cái gì mà … phép kiểm chi bình phương hay sao đó
Là để xác định DL có PPC không thì mình dùng phép kiểm chi bình phương
Còn điều kiện phương sai đồng nhất thì sao?
Cái này dùng phép kiểm F thì đã đồng nhất rồi, mình đã kiểm rồi
Lý do SV nhanh chóng trả lời được câu hỏi này nằm ở chỗ đây là hai bài toán
KĐ đã được học. Tuy nhiên, hai bài toán này được xem xét từ trước một cách hoàn
toàn độc lập với việc nghiên cứu Ttb2.
GV gọi một SV lên bảng trình bày các bước của phép kiểm chi bình phương
trong bài toán KĐ tính chuẩn của DL. Thực hiện các bước này không khó với SV
nhưng thời gian thực hiện quá lâu. Hơn nữa, muốn thực hiện phép kiểm chi bình
phương thì phải đưa DL gốc về dạng bảng ghép lớp. Nhược điểm của bảng ghép lớp
là thông tin sẽ bị mất mát và đôi khi dẫn đến kết luận sai. Đa số SV đều biết các
nhược điểm này. Điều này thể hiện trong câu trả lời đồng thanh (“quá lâu”, “nửa
tiếng”) của SV khi GV đặt câu hỏi : “phép kiểm chi bình phương thực hiện có lâu
không? Trong khoảng bao nhiêu phút?”
GV phân tích về các nhược điểm của phép kiểm chi bình phương và đưa ra
một phương pháp KĐ tính chuẩn của DL thay thế phép kiểm chi bình phương nhằm
khắc phục nhược điểm này. Đó là phép kiểm Shapiro có sẵn trong phần mềm R.
Phần cuối của pha này, GV giới thiệu phần mềm R với hàm shapiro.test để
KĐ tính chuẩn của DL. SV hào hứng thực hiện công việc này và đưa ra kết luận DL
không có PPC một cách nhanh chóng.
Máy 24:
188
Không thực hiện được phép kiểm t vì hai mẫu DL không có cùng PPC
Như vậy, kết thúc pha này, SV đã tìm ra nguyên nhân sai lầm do DL không có
PPC. Tuy nhiên, họ không biết xử lý như thế nào, vì đây là một tình huống không
quen thuộc với họ.
6.5.2. Tình huống 2
Pha 2A
Cũng như pha 1A của tình huống 1, GV thông báo kết quả TK câu trả lời phổ
biến của SV: Trong số SV tính toán đúng thì 100% có kết luận là “Không có sự
khác biệt về nồng độ PSA của người bị Ung thư tiền liệt tuyến đã di căn và chưa di
căn”.
Để SV nhận ra câu trả lời này sai, GV cung cấp cho SV phiếu số 2 với tựa đề
“PSA và ung thư tiền liệt tuyến”. (Phụ lục 7)
Các nhóm tích cực thảo luận và nhận ra mâu thuẫn giữa thông tin trên phiếu số
2 với kết luận của bài toán mà họ đã đưa ra. Kết quả thảo luận được tóm tắt trên
giấy bài làm của SV:
Máy 38
- Trên thực tế, lượng PSA của người bị ung thư tiền liệt tuyến đã di căn cao hơn
so với người bị ung thư tiền liệt tuyến chưa di căn. Ở bài toán 1, kết luận
cuối cùng là lượng PSA của người bị ung thư tiền liệt tuyến đã di căn không
khác so với người bị ung thư tiền liệt tuyến chưa di căn. Tại sao có sự khác
nhau đó?
Máy 7
- Theo phiếu số 2 thì lượng PSA của người bị ung thư tiền liệt tuyến đã di căn
lớn hơn so với người bị ung thư tiền liệt tuyến chưa di căn. Nhưng bài toán
mình giải thì không có sự khác biệt.
Pha 2B: Tìm nguồn gốc sai lầm
Vì đã gặp một bài toán tương tự trong tình huống 1, nên sau khi thảo luận
nhóm, SV đã nhanh chóng khoanh vùng các nguyên nhân có thể dẫn đến sai lầm.
Máy 38
189
- Ta phải xem DL bài toán có thỏa các điều kiện sau không : Phương sai có đồng
nhất không? DL có PPC không? Hai mẫu có độc lập không?
- Phương sai đồng nhất đã kiểm tra rồi mà
Máy 23
- Có thể chỉ có hai nguyên nhân đó thôi, các bước đã đúng hết rồi.
Các nhóm tiếp tục kiểm tra hai điều kiện của phép kiểm t. Sau khi dùng phép
kiểm F thì thấy hai phương sai đồng nhất
Nếu như trong bài toán 4, DL không có PPC, thì ở đây tất cả các điều kiện của
phép kiểm t đều thỏa mãn: hai mẫu độc lập, phương sai đồng nhất, DL có PPC.
Chính vì vậy, SV bắt đầu thể hiện sự bối rối:
Máy 7 :
- Tất cả các điều kiện đều thỏa mãn rồi, vậy nguyên nhân ở đâu, T?
- Vậy chắc là có nguyên nhân nào khác nữa.
Kết thúc pha này, SV vẫn chưa tìm ra nguyên nhân sai lầm.
Pha 2C: Lựa chọn phép kiểm một đuôi hay hai đuôi.
GV đặt ra câu hỏi: Các bài toán trong giáo trình đều hỏi có sự khác biệt hay
không giữa hai đại lượng trung bình. Với câu hỏi đại lượng nào lớn hơn đại lượng
nào, phương pháp điều trị này có tốt hơn phương pháp điều trị kia không thì phải sử
dụng phép kiểm nào?
SV trả lời đồng thanh “một đuôi” vì họ đã có một ví dụ về phép kiểm u một
đuôi trong bài toán so sánh hai tỷ lệ. Họ cũng phân biệt được những tình huống sử
dụng phép kiểm một đuôi và hai đuôi. Tuy nhiên, phép kiểm này xuất hiện trong
giáo trình V1 còn rất mờ nhạt và hoàn toàn không được nói đến khi xem xét kiểu
nhiệm vụ Ttb2
Máy 29 :
- Mình đang làm là hai đuôi đúng không?
- Hai đuôi là nó có khác nhau hay không thôi, còn một đuôi là cái nào cao hơn
cái nào.
- Một đuôi có nói trong sách nhưng có chút xíu à.
190
Sau khi thảo luận nhóm, hầu hết các nhóm đều trả lời được lý do sử dụng phép
kiểm một đuôi.
Kết thúc pha này, SV nhận thấy sự cần thiết của phép kiểm một đuôi và lý do
sử dụng phép kiểm này nhưng chưa giải được bài toán 1 do SV chưa có kỹ thuật
thực hiện phép kiểm này.
Pha 2D: Giới thiệu phép kiểm một đuôi
GV trình bày phép kiểm một đuôi, minh họa bằng hình vẽ trên bảng :
t
Sau khi có kỹ thuật, SV làm việc nhóm để giải bài toán 1. Kết quả tính toán
tbτ thực hiện phép kiểm một đuôi vận hành khá tốt, các
1 2
của SV cho thấy, kỹ thuật
bước của kỹ thuật rất rõ ràng.
1 > µ 2
Đặt : H0 = µ
2; HA:µ
Máy 19
t =1,93, giá trị ngưỡng C = tE
A(69) = 1,667 ⇒ t > C : Bác bỏ HA 0E
A0,1A
A, chấp nhận HRA
Vậy lượng PSA của người Ung thư tiền liệt tuyến có di căn cao hơn lượng PSA của người
Ung thư tiền liệt tuyến chưa di căn.
A E
SV thực hiện các bước của phép kiểm t một đuôi và câu trả lời tìm được phù
hợp với kiến thức y học cung cấp: PSA của người bị Ung thư tiền liệt tuyến đã di
căn cao hơn PSA của người bị Ung thư tiền liệt tuyến chưa di căn.
6.5.3. Tình huống 3
Pha 3A: Xử lý DL khi DL không có PPC
GV nhắc lại DL bài toán 2 không có PPC nên chưa thể dùng phép kiểm t để so
sánh hai trung bình và giới thiệu 3 cách để xử lý DL trong trường hợp này
Cách 1: Tăng cỡ mẫu lên và KĐ DL sau khi tăng cho đến khi DL có PPC
Cách 2: Dùng các hàm toán học để hoán chuyển DL về PPC
Cách 3: Dùng các phép kiểm phi tham số để so sánh hai trung bình vì phép kiểm
này. không đòi hỏi điều kiện DL có PPC.
GV phân tích ưu, nhược điểm của từng phương pháp và đề nghị các nhóm
thực hiện theo cách 2: Hoán chuyển DL và làm mẫu một ví dụ sử dụng cách này
bằng hàm toán học Y = log(X)
191
Pha 3B: Kiểm tra hai điều kiện của DL sau hoán chuyển.
Đến pha này, SV đã biết rằng muốn thực hiện phép kiểm t cần phải kiểm tra
các điều kiện về tính đồng nhất của phương sai và tính chuẩn của DL.
Pha 3C: Giải bài toán 2 bằng phép kiểm t một đuôi
Đến pha này, SV cũng biết phải thực hiện phép kiểm t một đuôi đối với bài
toán 2 vì cần phải trả lời câu hỏi : “Nồng độ HbA1c của nhóm người bị đái tháo
đường có cao hơn người bình thường không”. Điều này thể hiện trong tất cả các bài
làm của các nhóm.
Kết thúc pha này, SV đưa ra kết luận phù hợp với kiến thức y học về bệnh đái
tháo đường mà bác sĩ đã trình bày trong đoạn video bài giảng.
Pha 3D : Thể chế hóa
- GV thể chế hóa các bước thực hiện kiểu nhiệm vụ TRtb2R: So sánh hai trung bình
thực nghiệm độc lập.
6.6. KẾT LUẬN CHƯƠNG 6
Trong chương này, chúng tôi cũng đã xây dựng một đồ án DH nhằm khắc
phục những khiếm khuyết của tổ chức toán học đã chỉ ra. Các mục tiêu của đồ án
DH đều đạt được: SV đã có ý thức trong việc kiểm tra các điều kiện của phép kiểm
t, biết cách xử lý tình huống khi các điều kiện này không thỏa mãn, biết sử dụng
phép kiểm một đuôi phù hợp với yêu cầu của mỗi bài toán. SV cũng biết sử dụng
thêm một công cụ hỗ trợ trong việc giải quyết các bài toán liên quan đến phép kiểm
t trong KĐ giả thuyết TK.
Các phân tích trong chương này cũng cho thấy, SV đã tự nhận ra sai lầm khi
giải các bài toán thực tế vì kết luận của các bài toán mà họ đưa ra không phù hợp
với những tri thức y học. Điều này cho phép chúng tôi khẳng định tính đúng đắn
của giả thuyết nghiên cứu thứ hai:
Giả thuyết 2: SV có thể nhận ra sai lầm của mình thông qua hoạt động giải quyết
các tình huống phá vỡ hợp đồng, được thiết kế theo quan điểm của phương pháp
DH tích cực, trong đó yếu tố môi trường cho phép họ bác bỏ sự vận dụng một kỹ
thuật ở ngoài phạm vi hợp thức của nó.
192
KẾT LUẬN CỦA LUẬN ÁN
1. Luận án đã thu được các kết quả chính sau đây:
- Trình bày một số công cụ lý thuyết của Didactic Toán như lý thuyết tình huống, lý
thuyết nhân chủng học, hợp đồng DH trong sự kết nối với quan điểm DH tích cực,
góp phần làm đa dạng kho tàng Lý luận và Phương pháp DH môn toán ở nước ta.
Đây cũng là những công cụ lí giải cho hầu hết cho các nghiên cứu trong luận án.
- Thực hiện một điều tra sơ bộ về những ứng dụng của XS-TK trong y học. Điều tra
này cho chúng ta thấy một cái nhìn toàn diện về những đóng góp của XS-TK trong
nghiên cứu y học, trong chẩn đoán, điều trị, phát triển các loại thuốc mới, các
phương pháp điều trị mới, …
- Phân tích một số sai lầm thường gặp trong các nghiên cứu y học có sử dụng XS-
TK, lí giải các nguyên nhân sai lầm, từ đó đề xuất phương pháp DH KĐ giả thuyết
TK và thể hiện qua một đồ án DH.
- Phân tích tri thức luận về quá trình hình thành, phát triển, vị trí, vai trò của KĐ giả
thuyết TK và PPC. Phân tích cho thấy những khó khăn, chướng ngại, thậm chí sai
lầm mà các nhà khoa học đã gặp phải trong quá trình khám phá và sử dụng PPC.
Phân tích cũng đã chỉ ra nhu cầu cần thiết của KĐ giả thuyết TK, các bài toán mà
KĐ giả thuyết TK có thể giải quyết, các phương pháp KĐ TK như KĐ ý nghĩa của
Fisher và KĐ giả thuyết của Pearson - Neyman, mô hình KĐ giả thuyết TK hỗn hợp
ứng dụng trong y học mà tiêu biểu là nghiên cứu lâm sàng đối chứng ngẫu nhiên.
- Phân tích quan hệ thể chế R(IRVR, O), R(IRFR, O) và R(IRAR,O) bằng quan điểm so sánh.
Phân tích đã chỉ ra những điểm giống và khác nhau giữa ba thể chế, các tổ chức
toán học liên quan đến O hiện diện trong chương trình, tìm ra các điểm tương đồng
và khác biệt giữa ba thể chế nhằm làm rõ mục đích, ý nghĩa của các tổ chức toán
học được đưa vào chương trình. Phân tích cũng cho thấy yếu tố đào tạo nghề trong
ba thể chế đã được thể hiện rõ thông qua việc giải quyết các nhiệm vụ của y học
như đánh giá các thuật điều trị, phát triển các loại thuốc, ứng dụng của XS-TK trong
điều trị và chăm sóc bệnh nhân, trong nghiên cứu y học.
193
Luận án cũng chỉ ra sự ảnh hưởng của lựa chọn thể chế đến hiệu quả đào tạo
XS-TK cho cán bộ y tế.
- Luận án đã kiểm chứng tính khả thi và hiệu quả của một đồ án DH KĐ giả thuyết
TK từ quan điểm DH tích cực.
Toàn bộ những kết quả trên đây cho thấy nhiệm vụ nghiên cứu của luận án đã
được hoàn thành, giả thuyết khoa học đặt ra trong luận án đã được khẳng định.
2. Nghiên cứu mở ra từ luận án
Nghiên cứu ảnh hưởng của mối quan hệ thể chế với một số tri thức XS-TK
trong y học tại trường Đại học Y, thuộc Đại học Grenoble, cộng hòa Pháp. Triển
khai một đồ án DH XS-TK tại đại học này, trên cơ sở đó đánh giá và so sánh về
hiệu quả của đồ án đã thực hiện tại Đại học Y dược Tp.HCM.
194
DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ
1. Đào Hồng Nam (2010), Mối quan hệ thể chế với phân phối chuẩn trong việc dạy
và học xác suất thống kê ở Trường Đại Học Y Dược Tp. HCM, Tạp chí Khoa
học, Trường Đại học Sư phạm Tp.HCM, số 24.
2. Đào Hồng Nam (2011), Phân tích thực hành hoạt động giảng dạy của giảng viên
qua tiết học về mô hình ngưỡng, Tạp chí Khoa học, Trường Đại học Sư phạm
Tp. HCM, số 28.
3. Đào Hồng Nam (2012), Lợi ích của phân tích tri thức luận trong dạy học xác
suất thống kê - Một phân tích tri thức luận về phân phối chuẩn, Tạp chí Khoa
học, Trường Đại học Sư phạm Tp.HCM, số 33
4. Đào Hồng Nam (2012), Nghiên cứu sai lầm của người học từ cách tiếp cận của
"Hợp đồng dạy học", Tạp chí Khoa học, Trường Đại học Sư phạm Tp.HCM,
số 34.
5. Đào Hồng Nam (2013), Đồ án didactic – một nghiên cứu thực nghiệm về dạy học
phân phối chuẩn trong kiểm định giả thuyết thống kê, Tạp chí Khoa học,
Trường Đại học Sư phạm Tp.HCM, số 45.
6. Lê Thị Hoài Châu, Đào Hồng Nam, Une étude sur la pratique d’enseignement
des probabilités dans la formation des medecins. Actes EMF 2012 (Espace
Mathématique Francophones), Genève.
7. Đào Hồng Nam (2013), Test d’hypothèse statistique. Une ingénierie didacticque.
Actes du Colloque International Franco-Vietnamien en Didactique des
Mathématiques, Ho Chi Minh ville du 02 au 04 janvier 2013.
8. Lê Thị Hoài Châu, Đào Hồng Nam (2013), Statistics and probability teaching for
medicine and pharmacy, International Conference on Mathematical Research,
Education and Applications, ICMREA – UEL 2013, HCMC.
195
DANH MỤC TÀI LIỆU THAM KHẢO
A. Tiếng Việt
1. Nguyễn Thị Tân An (2013), "Mô hình hóa toán học trong dạy học xác suất -
thống kê ở trường phổ thông", Hội thảo quốc tế Didactic và Phương pháp
dạy học Toán, Tp.HCM.
2. Trần Túy An (2007), Nghiên cứu thực hành giảng dạy khái niệm xác suất trong
các lớp song ngữ và các lớp phổ thông Việt Nam, Luận văn thạc sĩ giáo dục
học, Đại học Sư phạm Tp.HCM.
3. Bessot A., Comiti C., Lê Thị Hoài Châu, Lê Văn Tiến (2009), Những yếu tố cơ
bản của Didactic Toán, NXB Đại học Quốc gia Tp.HCM.
4. Bessot A. (2013), "Một phân tích đối chiếu về hai giáo trình xác suất – thống kê
dành cho ngành Y ở Pháp và Việt Nam", Hội thảo quốc tế Didactic và
Phương pháp dạy học Toán, Tp.HCM.
5. Birebent A. (2013), "Những bài toán cơ bản nào và những đối tượng toán học nào
cho việc dạy thống kê ?", Hội thảo quốc tế Didactic và Phương pháp dạy học
Toán, Tp.HCM.
6. Comiti C., Lê Thị Hoài Châu (2011), "Những đóng góp của Thuyết nhân học đối
với việc phân tích giờ học trên lớp", Tạp chí Khoa học, Đại học Sư
phạm Tp.HCM, số 28.
7. Bộ giáo dục và đào tạo (2001), Chương trình đào tạo bác sĩ đa khoa, Hà Nội.
8. Bộ giáo dục và đào tạo (2012), Chương trình khung giáo dục đại học - khối
ngành Khoa học sức khỏe, Hà Nội.
9. Bộ môn Toán (2011), Chương trình khung về xác suất thống kê, Đại học Y dược
Tp.CM.
10. Lê Thị Hoài Châu (2001), Đề tài nghiên cứu khoa học cấp Bộ, mã số B2001-23-
02
11. Lê Thị Hoài Châu (2002), "Khoa học luận và Didactic", Tạp chí Khoa học, Đại
học Sư phạm Tp HCM, số 32.
196
12. Lê Thị Hoài Châu (2010a), "Những chướng ngại, khó khăn trong dạy học khái
niệm xác suất", Tạp chí Khoa học, Đại học Sư phạm Tp.HCM, số 24.
13. Lê Thị Hoài Châu (2010b), "Dạy học thống kê ở trường phổ thông và vấn đề
nâng cao năng lực hiểu biết toán cho học sinh", Tạp chí khoa học, Đại học
Sư phạm Tp. HCM, số 25.
14. Lê Thị Hoài Châu (2012), Dạy học xác suất - thống kê ở trường phổ thông, Nxb
Đại học Sư phạm Tp.HCM.
15. Lê Thị Hoài Châu, Đào Hồng Nam (2013), "Một nghiên cứu về thực hành dạy
học xác suất trong đào tạo thầy thuốc", Hội thảo quốc tế Didactic và Phương
pháp dạy học Toán, Tp.HCM.
16. Hồ Thị Ngọc Dung, Châu Ngọc Hoa, “ Nồng độ acid uric huyết thanh ở bệnh
nhân tăng huyết áp”, Y học Tp. Hồ Chí Minh, tập 13, số 6 năm 2009, tr.41-
17. Tăng Minh Dũng (2010), Dạy học thống kê trong đào tạo giáo viên, Luận văn thạc sĩ,
Đại học Sư phạm Tp.HCM.
46.
18. Trần Anh Dũng (2013), Dạy học khái niệm hàm số liên tục ở trường Trung học
phổ thông, Luận án tiến sĩ, Trường Đại học Sư phạm Tp.HCM.
19. Lê Trường Giang (2007), Thống kê y học, NXB y học, Hà Nội.
20. Hoàng Nam Hải (2013), Phát triển năng lực suy luận thống kê cho sinh viên cao
đẳng chuyên nghiệp, Luận án tiến sĩ, Trường Đại học Vinh.
21. Đỗ Hàm (2007), Phương pháp luận trong nghiên cứu khoa học y học, NXB y
học, Hà Nội.
22. Đặng Đức Hậu (2010), Xác suất thống kê (dùng cho đào tạo bác sĩ đa khoa),
Nxb Giáo dục Việt Nam, Hà Nội.
23. Tạ Hữu Hiếu (2010), Dạy học môn thống kê toán học theo hướng vận dụng
trong nghiên cứu khoa học cho sinh viên các trường đại học thể dục thể thao,
Luận án tiến sĩ, Trường Đại học Sư phạm Hà Nội.
197
24. Nguyễn Đức Hoàng, Lê Thanh Hải, Lê Chuyển, Hoàng Khánh, Huỳnh Đình
Chiến, Phan Thị Danh (2004), “Nghiên cứu nồng độ Homosysteine máu -
yếu tố nguy cơ mới ở bệnh nhân nhồi máu não cấp”,
www.thankinhhoc.com/HomocysteinBSHoang%201.pdf
25. Đặng Vũ Hoạt, Hà Thị Đức (2004), Lý luận dạy học đại học, Nxb Đại học Sư
phạm, Hà Nội.
26. Ngô Tất Hoạt (2011), Nâng cao hiệu quả dạy học xác suất thống kê ở trường
đại học sư phạm kỹ thuật theo hướng bồi dưỡng một số thành tố năng lực
kiến tạo kiến thức cho sinh viên, Luận án tiến sĩ, Trường Đại học Vinh.
27. Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), Thống kê toán học,
Nxb Đại học Quốc gia Hà Nội.
28. Đỗ Mạnh Hùng (1993), Nội dung và phương pháp dạy "một số yếu tố của lí
thuyết xác suất" cho học sinh chuyên toán bậc phổ thông trung học Việt
Nam, Luận án tiến sĩ, Viện Khoa học Giáo dục Việt Nam, Hà Nội.
29. Vũ Như Thư Hương (2005), Khái niệm xác suất trong dạy học toán ở trung học
phổ thông, Luận văn thạc sĩ giáo dục học, Trường Đại học Sư phạm
Tp.HCM.
30. Trần Lương Công Khanh (2013), "Các nghịch lý trong lý thuyết xác suất và tác
động của chúng đến dạy và học", Hội thảo quốc tế Didactic và Phương pháp
dạy học Toán, Tp.HCM.
31. Trần Kiều (1988), Nội dung và phương pháp dạy thống kê mô tả trong chương
trình toán cải cách ở trường phổ thông cơ sở Việt Nam, Luận án tiến sĩ, Viện
Khoa học Giáo dục Việt Nam, Hà Nội.
32. Nguyễn Bá Kim (2005), “Nghiên cứu dạy học toán và đổi mới phương pháp dạy
học toán”, Hội thảo lần thứ nhất về Didactic – Phương pháp dạy học môn
Toán, Trường Đại học Sư phạm Tp.HCM.
33. Trần Thị Mỹ Loan, Trương Quang Bình (2009), “Tương quan giữa chỉ số khối
cơ thể và rối loạn lipid máu ở bệnh nhân tăng huyết áp”, Y học Tp. Hồ Chí
Minh, tập 13, số 1, tr.61-66.
198
34. Nguyễn Phú Lộc (2007), Xu hướng dạy học không truyền thống, Trường Đại
học Cần Thơ.
35. NEY M. (2013), "Chương trình LOE cho việc học thống kê ở trường Y: một
quan điểm didactic", Hội thảo quốc tế Didactic và Phương pháp dạy học
Toán, Tp.HCM.
36. Cao Phi Phong (2005), "Mối quan hệ giữa tăng homocysteine huyết tương và
nhồi máu não", Y học Tp. Hồ Chí Minh, tập 9, số 1, năm 2005.
37. Nguyễn Ngọc Rạng (2012), Thiết kế nghiên cứu & thống kê y học, NXB y học,
Hà Nội.
38. Lê Quang Sơn, Nguyễn Văn Chung, Nguyễn Văn Sách (2009), “Nghiên cứu đặc
điểm gây mê hồi sức trong phẫu thuật nội soi ruột thừa có bơm thán khí vào
ổ bụng”, Y học Tp. Hồ Chí Minh, tập 13, số 1, năm 2009, tr.481-487
39. Đặng Đức Tâm (2013), “Kết quả cắt tuyến tiền liệt qua niệu đạo bằng Bipolar”,
Tạp chí y dược học quân sự, số 3, năm 2013.
40. Nguyễn Chí Thanh (2011), “Tìm hiểu giá trị nồng độ NT – Pro ANP, MR – Pro
AMD trong chẩn đoán và tiên lượng trên bệnh nhân suy tim”, Luận văn cao
học, trường ĐH Y Dược Cần Thơ.
41. Nguyễn Chí Thành, Bùi Anh Kiệt (2013), "Kiến thức về Xác suất và Thống kê
của sinh viên những năm đầu đại học: một số kết quả từ một điều tra bảng
hỏi", Hội thảo quốc tế Didactic và Phương pháp dạy học Toán, Tp.HCM.
42. Đặng Hùng Thắng (2010), Mở đầu về lí thuyết xác suất và các ứng dụng, Nxb
Giáo dục Việt Nam, Hà Nội.
43. Trần Văn Thạch (2005), “Hạ can-xi huyết trong kiềm hô hấp cấp”, Y học Tp. Hồ
Chí Minh, tập 9. Số 4, tr.224 - 227.
44. Chu Văn Thọ, Trần Đình Thanh, Nguyễn Văn Liêng (2008), Xác suất Thống kê,
Đại học Y dược Tp.HCM.
45. Chu Văn Thọ, Trần Đình Thanh, Nguyễn Văn Liêng (2012), Xác suất Thống kê,
Đại học Y dược Tp. HCM.
199
46. Chu Văn Thọ, Trần Đình Thanh, Nguyễn Văn Liêng (2012), Bài tập Xác suất
Thống kê, Đại học Y dược Tp. HCM.
47. Đỗ Thị Thanh Thủy, Nguyễn Thị Thanh Minh, Nguyễn Thị Hoàng Phương,
Phùng Như Toàn, Phạm Việt Thanh, Trương Đình Kiệt, Trần Thị Trung
Chiến (2009), “So sánh các thông số tầm soát trước sinh ở nhóm thai phụ
mang thai bình thường và nhóm thai phụ mang thai hội chứng Down”, Y học
Tp. Hồ Chí Minh, tập 13, số 1, tr.204-210.
48. Lê Văn Tiến (2005), Phương pháp dạy học môn toán ở trường phổ thông, Nxb
Đại học Quốc gia Tp.HCM.
49. Lê Văn Tiến (2006), “Sai lầm của học sinh nhìn từ góc độ các lý thuyết về học
tập”, Tạp chí giáo dục, số 137, kì 1-5/2006, Hà Nội.
50. Phan Thị Tình (2011), Tăng cường vận dụng toán học vào thực tiễn trong dạy
học môn xác suất thống kê và môn quy hoạch tuyến tính cho sinh viên toán
đại học sư phạm, Luận án tiến sĩ, Viện Khoa học Giáo dục Việt Nam, Hà
Nội.
51. Huỳnh Thị Thanh Trang, Huỳnh Nghĩa, Lê Bạch Lan, Phạm Thị Huỳnh Giao,
Trần Thị Kim Thanh, Nguyễn Văn Tiên, Lê Quốc Việt (2008), "Bước đầu
khảo sát tăng đông trên bệnh nhân huyết khối tắc mạch",
www.115.org.vn/DOC/bckh1.pdf
52. Phạm Văn Trạo (2009), Xây dựng và thực hiện chuyên đề chuẩn bị dạy học xác
suất - thống kê ở trung học phổ thông cho sinh viên toán Đại học sư phạm,
Luận án tiến sĩ, Viện Khoa học Giáo dục Việt Nam, Hà Nội.
53. Nguyễn Văn Tuấn (2004), Hai mặt sáng tối của y học hiện đại, NXB trẻ, Tp.
HCM.
54. Nguyễn Văn Tuấn (2007), Phân tích số liệu và vẽ biểu đồ R, NXB Khoa học và
Kỹ thuật, Hà Nội.
55. Nguyễn Văn Tuấn (2010), "Kiểm định t và hoán chuyển số liệu",
http://www.ykhoanet.com/baigiang/lamsangthongke/lstk05_kiemdinht.pdf
56. Nguyễn Văn Tuấn (2011a), "Diễn giải kết quả chẩn đoán bằng xác suất",
200
http://www.ykhoa.net/baigiang/phuongphapnghiencuu/080716_nguyenvantu
an_Dien_dich_chan_doan_bang_xac_suat.pdf
57. Nguyễn Văn Tuấn (2011b), "Ý nghĩa của odds ratio và relative risk",
http://statistics.vn/index.php?option=com_content&view=article&id=61%3
Ay-nghia-cua-odds-ratio-va-relative-risk&catid=72&showall=1
58. Nguyễn Văn Tuấn (2011c), "Ý nghĩa của trị số P",
http://statistics.vn/index.php?option=com_content&view=article&id=35:y-
nghia-cua-p-value&catid=51:test-princ-pval&Itemid=38
59. Nguyễn Văn Tuấn (2012), “Nghiên cứu y học ở Việt Nam: đặc điểm thiếu sót
và sai sót”, http://chrd.edu.vn/site/vn/?p=2702
60. Đặng Quốc Việt, Phạm Hữu Thông (2010), “Vai trò của C-reactive protein
trong chẩn đoán viêm ruột thừa cấp”, Y học Tp. Hồ Chí Minh, tập 14, số 1.
61. Vũ văn Vũ (2011), “Dấu hiệu sinh học ung thư”,
http://www.medinet.hochiminhcity.gov.vn/ttyh/bshkhkt/dau%20hieu%20sinh
%20hoc%20ung%20thu.htm
62. Trần Thị Hoàng Yến (2011), Vận dụng dạy học theo dự án trong môn xác suất
thống kê ở trường đại học (chuyên ngành kinh tế kỹ thuật), Luận án tiến sĩ,
Viện Khoa học Giáo dục Việt Nam, Hà Nội.
B. Tiếng Anh
63. Abbe C. (1871), "A Historical Note on the Method of Least Squares", Amer.
Jour. of Science, 1: 411–415, third series.
64. Adrain R. (1808), "Research concerning the probabilities of the errors which
happen in making observations, &c". The Analyst, or Mathematical
Museum. Vol. I, Article XIV, 93–109. Philadelphia: William P. Farrand and
Co.
65. Bass JW, Steele RW, Wittler RR, et al (1993), “Antimicrobial treatment of
occult bacteremia: a multicenter cooperative study”, Pediatr Infect Dis
J.;12:466-73
66. Bernshtein S.N. (1946), Probability theory, Moscow-Leningrad.
201
67. Beth Dawson, Robert G.Trapp (2004), Basic & Clinical Biostatistics,
Department Medicine at Southern Illinois University School of Medicine,
USA.
68. Betty R. Kirkwood, Jonathan A.C.Sterne (2003), Essential Medical Statistics,
2nd Edition, Blackwell Publishing.
69. Brousseau G. (1998), Theory of Didactical Situations in Mathematics, Kluwer
Academic Publishers.
70. BROUSSEAU G., BROUSSEAU N. (1987) Rationnels et décimaux dans la
scolarité obligatoire, Publication de l'I.R.E.M. de Bordeaux
71. Brousseau G., Brousseau N. & Warfield G (2002), "An experiment on the
teaching of statistics an probability", Journal of mathematical Behaviour of
chidren, Vol.20, p.363-411, Edition Elsevier Science.
72. De Moivre A. (1756), The Doctrine of Chances: or a method of calculating the
probability of events in play, London.
73. Douglas Curran-Everentt (2009), “Explorations in statistics: hypothesis tests and
P Values”, The American Physiological Socielty, 33: 81-86.
74. Dutka J. (1990), “Robert Adrain and the method of least squares”,
Archiveor History of. Exact Sciences, 41:171-184.
75. Edwards, D., Hamson, M. J. (2001), Guide to Mathematical Modelling,
Second Edition. London: Palgrave Mathematical Guides.
76. Eykhoff P. (1974), System identification: parameter and state estimation,
Wiley- Interscience, New York.
77. Fisher, R.A. (1974), Collected Papers of R.A. Fisher (1971–1974). Five
Volumes, University of Adelaide.
78. Galton F. (1888), "Corelation and their merasurements, chiefly on
anthropometric data", Proceedings of Royal Society, 45: 135-145.
79. Gauss C. F. (1857), Theoria Motus Corporum Coelestium in Sectionibus
Conicis Solem Ambientium, Translation by Charles Henry Davis, Boston.
202
80. Gigerenzer, Swijtnik, Porter, Beatty, Kruger, Daston (1989), The empire of
chance, Cambridge University Press.
81. Hayter A.J. (2007), Probability and statistics for engineering and the sciences,
third edition, Thomson, USA
82. Jay, L. Devore (2004), Probability and statistics for engineering and the
sciences, xixth edition, Thomson, USA.
83. Jesper Jerkert (2011), "The Basics of Statistical Hypothesis Testing",
http://www.jerkert.se/jesper/hypothesis_testing_article.pdf
84. Keynes J. M. (1921), A Treatise on Probability, Macmillan, London.
85. Kenneth W. Lyles, et al (2007), “Zoledronic Acid and Clinical Fractures and
Mortality after Hip Fracture”, N Engl J Med 2007; 357:1799-1809.
86. Lyapunov, A.M. (1954), "Collected works", Moscow-Leningrad, 1: 157–176.
87. Marya D Zilberberg, Alex Exuzides, James Spalding, Aimee Foreman, Alison G
Jones, Chris Colby, Andrew F Shorr (2008), “Hyponatremia and hospital
outcomes among patients with pneumonia: a retrospective cohort study”,
BMC Pulmonary medicine, 1/2008: 8-16.
88. Maxwell, J.C. (1860), “Illustrations of the Dynamical Theory of
Gases”, Philosophical Magazine, 19: 19-32.
89. Maxwell, J.C. (1860), “Illustrations of the Dynamical Theory of
Gases”, Philosophical Magazine, 20, 21-27.
90. Moore DS, McCabe GP. (2006), Producing data in Introduction to the Practice
of Statistics, 5th ed. New York, NY: W.H. Freeman and Company;191–250
91. Pauker SG, Kassirer JP (1980), “The threshold approach to clinical decision
making”, N Engl J Med; 302:1109-1117.
92. Pearson, K. (1900), "On the Criterion that a given System of Deviations from
the Probable in the Case of a Correlated System of Variables is such that it
can be reasonably supposed to have arisen from Random Sampling".
Philosophical Magazine Series 5, 50 (302): 157–175.
203
93. Sellke, T., Bayarri M.J, Berger, J.O (2001), “Calibration of p-values for testing
precise null hypothesis”, The American Statistician; 55: 62-71
94. Stigler S.M. (1977), “An attack on Gauss, Legendre”, Historia Math; 4: 31-35.
95. Stigler S.M. (1978), “Mathematical statistics in the early States”, Annals of
Statistics; 239-265.
96. Susan Miles, Gill M Price, Louise Swift, Lee Shepstone and Sam J Leinster
(2010), "Statistics teaching in medical school: Opinions of practising
doctors" School of Medicine, Health Policy and Practice, Faculty of Health,
University of East Anglia, Norwich, NR4 7TJ, UK.
97. Van Crevel H., Habbema JD, Braakman R (1986), “Decision analysis of the
management of incidental intracranial saccular aneurysms”, Neurology;
36(10):1335-1339.
98. Yule, G. U. (1900). "On the Association of Attributes in Statistics: With
Illustrations from the Material of the Childhood Society, &c", Philosophical
Transactions of the Royal Society A, Mathematical, Physical and
Engineering Sciences, 194 (252–261): 257–226.
99. Yule, G. U. (1907), "On the Theory of Correlation for any Number of Variables,
Treated by a New System of Notation", Proceedings of the Royal Society
A, Mathematical, Physical and Engineering Sciences 79 (529): 182–126.
C. Tiếng Pháp
100. Artaud M. (1993) La mathématisation en économie comme problème
didactique -Une étude exploratoire. Thèse pour l’obtention du grade de
docteur de l’Université d’Aix-Marseille II. Marseille: IREM d’Aix-
Marseille.
101. Artigue M. (1992), “Ingénierie didactique”, Recherche en didactique des
Mathématiques, La Pensée Sauvage, Grenoble.
102. Bénichou, R. Beusccart, P. Roy, C. Quantin (2009), Biostatistique.
103. Bair J., Hasbroeck G. (2002), “Sur l’enseignement de la statistique en communauté française de Belgique”, Repere-IREM No48, p.41-58.
204
104. Briand J. (2005), "Une expérience statistique et un première approche des lois
du hasard au lycée par une confrontation avec une machine simple",
Recherches en Didactique des Mathématiques, vole 25/2, Edition La
Pensée Sauvage, Grenoble.
105. Brousseau G. (1980), "Problèmes de l’enseignement des décimaux",
Recherche en Didactiques des Mathématiques, 1, 11-59.
106. Brousseau G. (1998), Théorie des situations didactiques, La pensée Sauvage,
107. CASTELAT C. (2008), "Travailler avec, travailler sur la notion de praxéologie
mathématique pour décrire
les besoins d'apprentissage
ignorés par
les
institutions d'enseignement", Recherches en Didactique des Mathématiques.
28(2), 135-182. La Pensée Sauvage, Grenoble.
108. CASTELAT C. (2012), "Des mathématiques aux scieznces physiques. Exemples
d’effets transpositif", Artes EMF 2012, Gienève.
109. Chevallard Y. (1985), La transposition didactique - du savoir savant au savoir
enseigné, éd. La Pensée Sauvage, Grenoble.
Grenoble.
110. Chevallard Y. (1991), "Concepts fondamentaux de la didactique: perspectives
apportées par une approche anthropologique", Recherches en Didactique
des Mathématiques; 12(1): 73-112., éd. La Pensée Sauvage, Grenoble.
111. Chevallard Y. & Wozniak F. (2005), Enseigner la statistique au secondaire,
entre genre prochaine et différence spécifique, in A. Mercier & C.
Margolinas, Balise ne Didactique des Mathématiques, p. 195-218, Edition
La Pensée Sauvage, Grenoble.
112. Comiti C. (2004), “L’observation des classes ordinaires: un outil pour la
recherche?” Actes du séminaire Recherche – Action, Nha Trang.
113. Coutigno C. (2001), Introduction aux situations aléatoires dès le collège: de
la modélisation à la simulation d’expérience de Bernoulli dans
205
l’environnement informatique Cabri-géomètre 2. Thèse de doctorat,
Université Joseph Fourier, Grenoble.
114. Hoai-Chau LE, Hong-Nam DAO, "Une étude sur la pratique d’enseignement
des probabilités dans la formation des medecins", Actes EMF 2012
(Espace Mathématique Francophones), Genève.
115. Henry M. (1994), L’enseignement du calcul des probabilités dans le second
dégré.Perspectives historiques, épistémologiques et didactique. Edition
IREM de Bsançon.
116. Henry M. (2004), La notion de probabilité: évolution historique et
applications contemporaines, IREM de Franche-Comté.
117. Laplace, P. S. (1774), "Mémoire sur la Probabilité des Causes par les
Événements," Savants Étranges 6: 621-656, also Oeuvres 8: 27-65, Paris.
118. Laplace, P. S. (1782), "Mémoire sur les suites", Mém. Acad. R. Sci., 10: 1-89,
Paris.
119. Laplace, P. S. (1812), "Théorie analytique des probabilités", MmeVCourcier,
Imprimeur-Libraire des Mathématiques, Quai de Augustins, 57, Paris.
120. Laplace, P. S. (1819), "Mémoire sur l'application calcul des probabilités aux
observations et spéciallement aux opérations du nivellement." Annales de
Chimie et de Physique, Paris.
121. Pichard J-F. (1997), "La théorie des probabilités au tournant du XVIIe siècle et
Frise historique sur la probabilité et la statistique", Enseigner les
probabilités au lycée, 105-130, Commission Inter-IREM STATISTIQUE
ET PROBABILITÉS.
122. Quételet A. (1835), "Sur l’hommes et le développement de ses facultés", Ou
essay de physique sociale, Vol.2, Paris.
PHỤ LỤC 1
MỘT SỐ ỨNG DỤNG CỦA XS-TK TRONG Y HỌC
1. Độ chính xác của một xét nghiệm
Để đánh giá độ chính xác của một xét nghiệm, trong y học người ta thường
dùng các thông số như độ nhạy và độ chuyên (độ đặc hiệu)
+
= ss P T
(
B+ /
)
- Độ nhạy là khả năng xét nghiệm cho kết quả dương tính đối với những người bị
bệnh B, tức là . Độ nhạy cũng còn được gọi là dương thật.
−
= sp P T
(
B− /
)
- Độ chuyên là khả năng xét nghiệm cho kết quả âm tính đối với những người
. Độ chuyên cũng còn được gọi là âm thật. không bị bệnh B, tức là
Để xác định hai thông số này, kết quả chẩn đoán của xét nghiệm được nghiên
cứu sẽ được so sánh với kết quả của xét nghiệm chuẩn (gold standard test) trong
một quần thể bệnh nhân. Xét nghiệm chuẩn là mốc cuối cùng để xác định bệnh và
thường mang tính xâm lấn, tốn kém về thời gian và kinh phí thực hiện. Ngược lại,
xét nghiệm được nghiên cứu là xét nghiệm thường dùng hàng ngày, ít tốn kém và
dễ thực hiện.
Bảng 1 cho biết kết quả xét nghiệm T đối với người bị bệnh ( B+ ) và không bị
bệnh ( B− ).
Bảng 1: Kết quả xét nghiệm T
B+
B−
Bệnh B Tổng cộng xét nghiệm T
T +
a b a+b
T −
c d c+d
N Tổng a+b b+d
+
+
=
= ss P T
(
/
B
)
Hai thông số này được tính theo công thức XS có điều kiện:
a + a b
−
−
=
= sp P T
(
/
B
)
Độ nhạy
d + b d
Độ chuyên
Để đánh giá về một xét nghiệm, người ta cũng sử dụng khái niệm âm giả và dương
giả. Theo đó, ta có các định nghĩa sau:
P T (
B− /
- Âm giả là khả năng xét nghiệm cho kết quả âm tính đối với người bị bệnh B và
+ )
được diễn tả theo XS có điều kiện là
P T (
B+ /
- Dương giả là khả năng xét nghiệm cho kết quả dương tính đối với người không bị
− )
bệnh B và được diễn tả theo XS có điều kiện là
−
+
+
+
= −
P T (
/
B
) 1
P T (
/
B
)
Dựa vào tính chất của XS, ta có:
+
−
−
−
= −
B
B
P T (
/
) 1
P T (
/
)
Âm giả =
Dương giả =
2. Giá trị tiên đoán
Giá trị tiên đoán cũng là các XS có điều kiện, nó phụ thuộc vào kết quả của XN T
+
+
=
PV
+ P B T
(
/
)
dương tính hay âm tính.
- Giá trị tiên đoán dương: là XS bị bệnh B nếu xét nghiệm T
−
−
=
PV
− P B T
(
/
)
dương tính.
- Giá trị tiên đoán âm: là XS không bị bệnh B nếu xét nghiệm T
âm tính.
Để xác định hai giá trị tiên đoán này, các phương pháp sau đây thường được
sử dụng: phương pháp Bayes, phương pháp cây quyết định, phương pháp tỷ cơ hội.
+
+
+
+
B
(
/
)
/
+
+
=
=
=
PV
+ P B T
(
/
)
+
−
B − P B P T
B
+ P B P T
+ P B P T ). ( + P T (
)
+ P B P T ). ( ( + + + B )
/
) ). (
(
/
)
). (
(
− 1
+
1
sp
+
=
+
) 1 ×
PV
1
− ( P B + P B ) (
− ss
−
−
−
−
B
(
/
)
/
−
−
=
=
=
PV
− P B T
(
/
)
−
−
− P B P T ). ( − P T (
)
− P B P T ). ( ( + − + B )
/
B − P B P T
) ). (
(
/
B
)
+ P B P T
). (
(
− 1
+
1
ss
−
=
+
×
1
PV
P B ( ) + − P B (
)
1
− sp
+
+
+
+
−
=
+
P T (
)
+ P B P T
). (
(
/
B
)
− P B P T
). (
(
/
B
)
a. Phương pháp Bayes
với
−
−
+
−
−
=
+
)
). (
(
/
)
). (
(
/
)
( P T
+ P B P T
B
− P B P T
B
+
P B (
),
P B (
− là XS tiền nghiệm. )
gọi là công thức XS toàn phần và
Một bà 27 tuổi, có thai 17 tuần, bị bệnh tiểu đường phụ thuộc Insulin đã 5 năm, đến
khám về sản khoa. Trong ba tháng đầu của thai kỳ, bà ta không kiểm soát được đường
huyết, cứ cao hơn 200 mg%. Bà nghe nói trong ba tháng đầu thai kỳ mà không kiểm
soát được đường huyết thì thai dễ bị dị tật với tỷ lệ 20 - 30%. Bà đã làm XN SAF
(Maternal, Serum Alpha Foetoprotein) thấy dương tính. XN này có độ nhạy 34% và
độ chuyên 86%
- Bà này có thai bị dị tật là bao nhiêu?
- Có nên cho làm siêu âm không? Vì siêu âm có độ nhạy 56% và độ chuyên 99,5%?
(Chu Văn thọ và tgk, 2012, tr.242-243)
Ví dụ 1. Chẩn đoán thai dị tật
1 là XN SAF và T
2 là
Trong tình huống này, có 2 XN được thực hiện, gọi T
siêu âm.
1 dương tính, ta sử dụng giá trị tiên
− 1
− 1
+
sp
1
+
=
+
) 1 ×
=
+
1 0, 2 1 0,86 ×
=
PV
1
1
0,377
Để tính khả năng thai bị dị tật khi XN T
− P B ( + P B ( )
− ss
− 0,34
− 0, 2
2 để xác
đoán dương:
1, tức là
P B+ =
) 0,337
(
định. Khi đó, XS tiền nghiệm của T Như vậy khả năng thai bị dị tật chưa cao, bác sĩ cần chỉ định thêm T 2 chính là XS hậu nghiệm của T
2 cũng dương tính thì khả năng thai bị dị tật là
− 1
− 1
+
1
sp
+
=
+
) 1 ×
=
+
1 0,377 1 0,995 ×
=
1
1
0,985
PV
. Nếu T
− ( P B + P B ) (
− ss
− 0,377
− 0,56
. Với kết quả này,
khả năng thai bị dị tật là khá cao (khoảng 99%)
PV PV+ ,
Nếu có nhiều XN để hỗ trợ chẩn đoán một bệnh thì bác sĩ phải lựa chọn XN
− ? Để
nào tối ưu nhất trong các XN đó nhằm làm tăng hai giá trị tiên đoán
)
trả lời câu hỏi này, công thức Bayes sẽ được sử dụng trong trường hợp đã biết XS
P B+ của bệnh nhân.
tiền nghiệm (
- Muốn khẳng định bệnh khi XN dương tính thì cần giá trị tiên đoán dương PV + cao
(giá trị cao nhất là 1). Do đó phải chọn XN có sp cao, tức là phải chọn XN có độ
chuyên cao.
- Muốn loại trừ bệnh khi XN âm tính thì cần giá trị tiên đoán âm PV − cao (giá trị
cao nhất là 1). Do đó phải chọn XN có ss cao, tức là phải chọn XN có độ nhạy cao.
1 và T
2 ta cần chọn XN
2 vì T T
2 có độ chuyên cao hơn T
1.
Trong ví dụ 2.1, nếu phải lựa chọn một trong 2 XN T
b. Phương pháp cây quyết định
Bài toán 1 Bệnh B có tỷ lệ lưu hành trong cộng đồng D là 20%. Để chẩn đoán bệnh
B, bác sĩ dùng xét nghiệm T có độ nhạy 90% và độ chuyên 95%.
- Ông X trong D đến khám bệnh và có kết quả xét nghiệm T dương tính. Tính xác
suất ông X bị bệnh B.
- Bà Y trong D đến khám bệnh và có kết quả T âm tính. Tính xác suất bà Y không
bị bệnh B.
Bước 1: Vẽ cây quyết định và gán giá trị xác suất trên mỗi nhánh cây và tính
xác suất đầu cành. (xem hình 1)
Hình 1. Cây quyết định về bệnh B
Bước 2: Tính xác suất
Xác suất xét nghiệm T dương tính = 0,18 + 0,04 = 0,22 (cộng ở cành T + )
Xác suất xét nghiệm T âm tính = 0,18 + 0,04 = 0,78 (cộng ở cành T − )
+
+
=
PV
+ P B T
(
/
)
- Khả năng ông X bị bệnh B khi xét nghiệm T dương tính là:
= 0,18: 0,22 = 0,818
−
−
=
PV
− P B T
(
/
)
- Khả năng bà Y không bị bệnh B khi xét nghiệm T âm tính là:
= 0,76:0,78 = 0,974
Phương pháp cây quyết định cũng còn được sử dụng trong việc tính giá trị lợi
ích của các phương án xử trí một ca bệnh, từ đó tìm ra phương án xử trí tối ưu như
trong bài toán sau đây:
Phương pháp này cũng được sử dụng cho bài toán như sau:
Bài toán 2 (Van Crevel H, 1986)
Không có sự thống nhất trong cách xử lý túi phình mạch máu não bất ngờ
(incidental intracranial saccular aneurysms). Một số quyết định phẫu thuật, số khác
thì tiên lượng tốt nên không cần phẫu thuật nhất là đối với những túi phình có
đường kính nhỏ hơn 10mm.
Sự quyết định phẫu thuật hay không là một quyết định khó khăn vì nếu phẫu
thuật sẽ gây rủi ro tức thì, nếu không phẫu thuật thì túi phình có thể vỡ bất ngờ, gây
nguy hiểm lâu dài. Một số bệnh nhân muốn tránh phẫu thuật cho dù sự tốn kém có
thể nhiều hơn sau này, một số khác thì có thể không như vậy.
Năm 1986, Crevel và đồng nghiệp xem xét vấn đề trên đối với một bệnh nhân
nữ 45 tuổi, bị đau nửa đầu (Migraine) đã 2 năm nhưng vẫn khỏe mạnh. Mặc dù đã
dùng thuốc nhưng cơn đau nửa đầu vẫn không khỏi, gia đình bệnh nhân không có
tiền căn Migraine.
Bác sĩ thần kinh nghi ngờ bệnh nhân bị dị dạng mạch máu và cho làm
Angiography, phát hiện túi phình 7 mm ở giữa bên trái động mạch não. Bác sĩ có
nên tư vấn cho bệnh nhân phẫu thuật ngăn ngừa vỡ túi phình không?
Theo nghiên cứu, XS vỡ túi phình là 29% nếu không phẫu thuật và sau khi bị
xuất huyết não thì nguy cơ tử vong là 55%, tàn phế 15%. Nếu phẫu thuật thì nguy
cơ tử vong là 2% và tàn phế là 6%
Giá trị lợi ích trên mỗi đầu cành sắp từ nhỏ đến lớn: Chết (0 điểm), khỏe hoàn toàn
(100 điểm). Theo nghiên cứu:
- Nếu phẫu thuật thì điểm tàn phế sau phẫu thuật là 75, phục hồi sau phẫu thuật là
100 điểm.
- Nếu không phẫu thuật thì điểm tàn phế trong tương lai được đánh giá tốt hơn tàn
phế sau phẫu thuật và được cho 90,1; chết sau khi vỡ túi phình trong tương lai được
coi là tốt hơn chết sau khi phẫu thuật nên cho 60,2 điểm.
- Tính giá trị lợi ích (EU) nhánh vỡ túi phình
- Giá trị lợi ích khi quyết định phẫu thuật và không phẫu thuật? Nên chọn quyết
định nào?
Hình 2. Cây quyết định xử trí bệnh đau nửa đầu
Giải
EU (vỡ) = 0,55.60,2 + 0,15.90,1 + 0,3.100 = 76,625
EU( khi không phẫu thuật) = 0,29.76,6 + 0,71.100 = 93,214
EU(khi phẫu thuật) = 0,02.0 + 0,06.75 + 0,92.100 = 96,5
Vì giá trị lợi ích khi phẫu thuật lớn hơn khi không phẫu thuật nên chọn quyết
định phẫu thuật để ngăn ngừa vỡ túi phình.
Trong cây quyết định: Điểm xuất hiện nhánh cây gọi là nút (node). Nút vuông
là nút quyết định, là điểm mà tại đó quyết định được kiểm soát bởi người ra quyết
định. Nút tròn là nút khả năng, là điểm mà tại đó các kết quả có thể xảy ra một cách
ngẫu nhiên. (Xem hình 1)
c. Phương pháp tỷ cơ hội
Tỷ cơ hội (Likelihood Ratio, ký hiệu là LR) diễn tả tỷ số về kết quả XN đối
với một cá nhân bị bệnh B và kết qủa đó đối với cá nhân không bị bệnh B.
Như vậy, LR phụ thuộc vào kết qủa XN:
E
- Nếu XN dương tính thì tỷ cơ hội dương, LR+ =E DươngA Athật DươngA Agiả
Từ đó:
+ Khi LR+ > 1 thì dương thật lớn hơn dương giả: XN có ích trong chẩn đoán
+ Khi LR+ < 1 thì dương thật nhỏ hơn dương giả: XN không có ích trong chẩn đoán
+ Khi LR+ = 1 thì dương thật bằng dương giả: XN vô dụng, không nên chỉ định XN
E
có LR+ = 1.
- Nếu XN âm tính thì tỷ cơ hội âm, LR− =E ÂmA Agiả ÂmA Athật
Từ đó:
+ Khi LR− > 1 thì âm giả lớn hơn âm thật: XN không có ích trong chẩn đoán
+ Khi LR− < 1 thì âm giả nhỏ hơn âm thật: XN có ích trong chẩn đoán
LR− = 1.
+ Khi LR− = 1 thì âm giả bằng âm thật: XN vô dụng, không nên chỉ định XN có
Các khái niệm sau đây cũng được sử dụng khi tính toán giá trị tiên đoán bằng
phương pháp tỷ cơ hội:
- Số chênh của một biến cố B, ký hiệu là odd(B), là tỷ số về khả năng xảy ra và khả
năng không xảy ra của biến cố đó. Chẳng hạn, gọi B+ là biến cố bị bệnh B của một
+
+
=
o
dd(
B
)
cá nhân trước khi cho làm XN, số chênh của biến cố bị bệnh B là
P B ( ) + − P B (
)
1
. Tỷ số này còn gọi là tỷ số tiền nghiệm.
/B T+
+ là biến cố bị bệnh B sau
/B T+
− là biến cố bị bệnh B sau khi có kết quả XN
- Tỷ số hậu nghiệm phụ thuộc vào kết quả XN, gọi
khi có kết quả XN dương tính và
+
+
+
+
+
⇒
=
=
=
o
dd(
+ B T /
)
PV
) +
) +
+
o +
PV −
/ ( + P B T
PV
+ P B T − ( /
)
1
1
dd( o dd(
+ B T / + B T /
)
1
−
−
−
1
)
1
−
−
=
=
=
⇒
=
o dd(
+ B T /
)
PV
) −
PV −
−
+
+ P B T − ( /
/ ( + P B T
)
1
− − / ( P B T − − P B T ( /
)
− PV
1 + B T / dd(
)
1
o
+
+
B T+ /
B LR ).
B T+ /
B LR ).
+ = dd( o )
+ và dd( o
− = dd( o )
−
âm tính. Ta có:
với dd( o
Ví dụ 2: Bệnh B có tỷ lệ lưu hành trong cộng đồng D là 20%. Để chẩn đoán bệnh
B, bác sĩ dùng xét nghiệm T có độ nhạy ss = 90% và độ chuyên sp = 95%.
- Ông X trong D đến khám bệnh và có kết quả XN T dương tính. Tính XS ông X bị
bệnh B.
- Bà Y trong D đến khám bệnh và có kết quả XN T âm tính. Tính XS bà Y không bị
bệnh B.
+
+
=
=
=
o
dd(
B
)
0, 25
P B+ =
) 0, 2
(
Ta có các thông tin sau:
)
1
0, 2 0,8
( ) P B + − ( P B
ss
1
−
=
=
=
+ =
=
=
LR
0,105
LR
18
XS tiền nghiệm ; tỷ số tiền nghiệm
ss −
− sp
− 1 0,9 0,95
sp
1
0,9 − 1 0,95
+
o
B T+ /
B LR ).
+ = dd( o )
+ = 0,25.18 = 4,5
;
+
o
B T+ /
B LR ).
− = dd( o )
− = 0,25.0,105 = 0,025
Tỷ số hậu nghiệm dương: dd(
+
+
=
=
=
PV
0,818
Tỷ số hậu nghiệm âm: dd(
) +
o +
dd( o dd(
+ B T / + B T /
)
1
4,5 + 1 4,5
−
⇒
=
=
=
PV
0,975
- XS ông X bị bệnh B là:
−
+
+
o
1 + B T / dd(
)
1 1 0, 025
1
T và có cùng kết quả dương tính hoặc âm
- XS bà Y không bị bệnh B là:
T T 2,
,..., n
Nếu thực hiện liên tiếp nhiều XN 1
+
o
B T+ /
o
dd(
).
.
....
+ = )
+
tính thì:
+ B LR LR 2
+ 1
LR n
+
o
B T+ /
o
dd(
...
).
Tỷ số hậu nghiệm dương: dd(
− = )
−
− B LR LR LR . 1 n
− 2
Tỷ số hậu nghiệm âm: dd(
P B+ =
) 0, 2
(
Chẳng hạn, trong ví dụ 1 về chẩn đoán thai dị tật, với XS tiền nghiệm
1T (có độ nhạy ss = 0,34 và độ chuyên
, nếu thực hiện liên tiếp hai XN
2T (có độ nhạy ss = 0,56 và độ chuyên sp = 0,995) đều có kết quả
sp = 0,86) và
+
+
=
=
=
=
=
o
B
dd(
)
dương tính thì khả năng thai bị dị tật là bao nhiêu?
+ = LR 1
ss −
P B ( ) + − P B (
)
1
0, 2 0,8
1 4
sp
1
0,34 − 1 0,86
17 7
+
×
=
=
o dd(
).
.
= 112 68
112
B T+ /
Ta có: ; ;
+ = )
+ 1
+ = LR 2
ss −
1 17 + = × B LR LR 2 4 7
sp
1
0,56 − 1 0,995
; dd( o
2,T T đều có kết quả dương tính là:
+
+
=
=
=
PV
0,986
) +
o +
dd( o dd(
+ / B T + B T /
)
1
68 + 1 68
Khả năng thai bị dị tật khi cả hai XN 1
Vậy nếu cả hai xét nghiệm đều dương tính thì khả năng thai bị dị tật gần như
chắc chắn (khoảng 99%), kết quả này phù hợp với phương pháp tính bằng công
thức Bayes.
LR rất có ý nghĩa trong lâm sàng vì ổn định hơn các giá trị tiên đoán và chính
xác hơn các phương pháp khác trong trường hợp kết quả xét nghiệm có giá trị liên
tục. Đối với các phương pháp khác như Bayes, cây quyết định,… nhà nghiên cứu
buộc phải chia xét nghiệm thành hai mức (dương tính và âm tính) nên phải tìm điểm
cắt và trong mỗi mức như vậy có nhiều khoảng giá trị được dồn chung lại. Phương
pháp tỷ cơ hội có thể dùng cho các xét nghiệm có nhiều mức như trong ví dụ sau:
Ví dụ 3. Một bé trai 1 tuổi bị sốt cao 39,5 độ C trong hai ngày đến khám bệnh và
không có triệu chứng khác. XS tiền nghệm bệnh nhiễm trùng máu ở trẻ từ 3 đến 36
tháng tuổi khi bị sốt trên 39,5 độ là 4%. Kết quả xét nghiệm máu của bé có chỉ số
3 A. E
bạch cầu là 36000/mmA
3 A để chia xét nghiệm này thành 2 mức và có kết E
Nếu lấy điểm cắt là 15000/mmA
quả như trong bảng 2
Bảng 2. Kết quả xét nghiệm chỉ số bạch cầu
P B+ =
) 0, 04
(
Từ đó: độ nhạy ss = 55/60 = 0,916; độ chuyên sp = 177/452 = 0,391
Gọi B+ là biến cố “nhiễm trùng máu”, ta có XS tiền nghiệm là
− 1
− 1
+
sp
1
+
=
+
) 1 ×
=
+
=
PV
1
1
0, 058
− ss
− P B ( + P B ) (
− 1 0, 04 1 0,391 × 0, 0,916
− 0, 04
Vì chỉ số bạch cầu của bé là 36000 nên khả năng bị nhiễm trùng máu là:
Vậy khả năng nhiễm trùng máu nếu có chỉ số bạch cầu là 36000 rất thấp
(khoảng 6 %) so với XS tiền nghiệm của bệnh này ( 4 %).
Nếu chia xét nghiệm này thành nhiều mức với kết quả như trong bảng 3
Nhiễm trùng máu
Chỉ số bạch cầu
LR+
(đơn vị: 1000)
Có
Không
< 5
0
12
0
5 - 9,9
0
87
0
10 - 14,9
5
78
0,482
15 - 19,9
16
166
0,726
20 - 24,9
21
69
2,292
25 - 29,9
9
28
2,421
30 - 34,9
4
9
3,348
35 - 39,9
2
2
7,533
> 40
3
1
22,6
Tổng cộng
60
452
[Nguồn: Bass JW et al, 1993]
Bảng 3. Kết quả xét nghiệm chỉ số bạch cầu được chia thành nhiều mức
Với kết quả xét nghiệm chỉ số bạch cầu là 36000 thuộc nhóm 35000 - 39900
thì
LR+ = 7,533
+
+
=
=
=
o dd(
B
)
0, 042
P B ) ( + − P B (
)
1
0, 04 − 1 0, 04
+
+ =
=
×
o
dd(
B T+ /
B LR ).
0, 042 7,533 0,316
+ = dd( o )
+
+
=
=
=
PV
0, 24
; Ta có:
) +
o +
dd( o
dd(
+ / B T + B T /
)
1
0,316 + 1 0,316
Khả năng nhiễm trùng máu là:
Như vậy nếu chia xét nghiệm thành nhiều mức thì khả năng nhiễm trùng máu
là 24 %, tăng gấp 4 lần so với sử dụng xét nghiệm có hai mức.
3. Mô hình ngưỡng
Công việc của người thầy thuốc đòi hỏi phải đưa ra những quyết định chính
xác và hiệu quả. Để thực hiện điều này, ngoài kinh nghiệm, thì những công cụ có
thể hỗ trợ bác sĩ trong chẩn đoán và điều trị là rất quan trọng và cần thiết. xét
nghiệm là một trong những công cụ như vậy. Tuy nhiên, nếu chỉ định nhiều xét
nghiệm không cần thiết hoặc chỉ định sai xét nghiệm có thể gây tốn kém về kinh tế,
ảnh hưởng không tốt đến tình trạng sức khỏe bệnh nhân. Ngoài ra, việc chỉ định quá
nhiều xét nghiệm có thể làm cho quyết định của bác sĩ trở lên khó khăn hơn vì
những thông tin mà xét nghiệm mang lại. Do đó, việc lựa chọn và phân tích các xét
nghiệm sẽ mang lại độ chính xác và lợi ích cao nhất cho bệnh nhân, giúp bác sĩ đưa
ra các quyết định lâm sàng chính xác và hiệu quả hơn.
Trong một số trường hợp, đối với các xét nghiệm có kết quả là một trị số liên
).
tục, bác sĩ cần xác định xem với một đối tượng có kết quả xét nghiệm là x có bệnh (B+) hay không bệnh (B-
Khi đó, KĐ giả thuyết TK được sử dụng để KĐ xem đối tượng đó thuộc nhóm
nào (nhóm bệnh hay không bệnh). Nếu kết quả KĐ cho thấy đối tượng đó thuộc
nhóm bị bệnh thì với XS bệnh sau xét nghiệm có nên cho điều trị hay không. Mô
hình ngưỡng P-K sẽ giúp các bác sĩ lâm sàng giải quyết vấn đề này.
Mô hình này do Pauker và Kassier đưa ra vào năm 1980 như sau: (Pauker SG,
Kassirer JP, 1980)
Để ra quyết định cho một trường hợp lâm sàng, bác sĩ gặp phải các tình huống
sau đây:
- Để bệnh nhân theo dõi thêm mà không cần chỉ định xét nghiệm và cũng không
điều trị nếu XS bệnh của bệnh nhân quá thấp.
- Cho điều trị ngay nếu XS bệnh của bệnh nhân đủ để ra quyết định điều trị
- Cần chỉ định thêm các xét nghiệm nếu XS bệnh của bệnh nhân không đủ để ra
quyết định loại trừ và cũng không đủ để ra quyết định điều trị ngay.
γ (xem hình 3)
t và T
Mô hình ngưỡng P-K cho biết, tại một thời điểm, XS bệnh của bệnh nhân thuộc đoạn [0; 1], trong đoạn này có hai điểm đáng chú ý đó là T
Hình 3. Mô hình ngưỡng P - K
T t: là điểm mà tại đó không có sự khác biệt giữa việc để bệnh nhân theo dõi và cho
bệnh nhân làm xét nghiệm, gọi là ngưỡng xét nghiệm.
TE A: là điểm mà tại đó không có sự khác biệt giữa việc cho bệnh nhân điều trị và chỉ AγA
A E
định xét nghiệm, gọi là ngưỡng điều trị.
A thì
tE
Dựa trên mô hình này, nếu một đối tượng đến khám có XS bệnh nhỏ hơn TA
để bệnh nhân theo dõi, không chỉ định xét nghiệm, cũng không điều trị. Nếu XS
A thì cho điều trị ngay. Nếu XS bệnh thuộc đoạn (TA AγA
A) thì cần chỉ AγA
A; TE tE
A E A E bệnh lớn hơn TE
định xét nghiệm với mong muốn XS bệnh sau khi có kết quả xét nghiệm sẽ vượt ra
A và TE
A. Nếu xét nghiệm nào không làm cho XS bệnh vượt ra hai AγA
tE
A E hai ngưỡng TA
ngưỡng này thì xét nghiệm đó không có giá trị và không nên chỉ định những xét
nghiệm như vậy.
Xác định hai ngưỡng này là do nhận định của các bác sĩ lâm sàng. Đối với
bệnh mà việc thực hiện xét nghiệm đơn giản, không xâm lấn (chẳn hạn bệnh viêm
dạ dày), ít tốn kém về thời gian và kinh phí thì bác sĩ thường dễ dàng chỉ định xét
nghiệm, khi đó vùng xét nghiệm rộng ra, vùng điều trị hẹp lại. Đối với những bệnh
mà việc làm xét nghiệm mang tính xâm lấn (chẳng hạn bệnh ung thư), tốn kém về
thời gian và kinh phí thì bác sĩ ít chỉ định xét nghiệm, khi đó vùng điều trị rộng ra,
vùng xét nghiệm hẹp lại.
A và TE
A nêu trên, người ta còn sử AγA
tE
A E Ngoài phương pháp xác định hai ngưỡng TA
− 1
− 1
+
−
=
+
=
+
LR .
;
LR .
T γ
T t
B R
B R
1
1
dụng phương trình toán học sau đây:
Trong đó : R là tỷ lệ gây rủi ro (Risk) và B (Benefits) là tỷ lệ lợi ích của việc
điều trị.
Như vậy, việc kết hợp giữa KĐ giả thuyết TK và mô hình ngưỡng trong những
trường hợp này sẽ góp phần làm tăng tính chính xác của các chẩn đoán y học.
Ví dụ 4. Để phân biệt viêm phổi do vi trùng hay do virus, người ta đo nồng độ CRP
+ A là biến E
(C-Reactive Protein) (mg/l) trong máu và tìm điểm cắt để chẩn đoán. Gọi BA
A là biến cố viêm phổi do virus. Đo nồng độ CRP
- E
cố viêm phổi do vi trùng và BA
trong 11 người ở mỗi nhóm ta có kết quả trong bảng 4:
Bảng 4. Nồng độ CRP
B+ 3 6 11 12 13 15 17 19 10 20
B- 2 3 8 11 10 9 8 5 14 16
Nồng độ CRP của nhóm viêm phổi do vi trùng có cao hơn nồng độ CRP của
nhóm viêm phổi do virus không?
* KĐ tính chuẩn của DL:
- Vẽ biểu đồ tần số của DL ( Xem hình 4 và 5)
Hình 4. Nồng độ CRP của nhóm viêm phổi do vi trùng (VP_VT)
Hình 5. Nồng độ CRP của nhóm viêm phổi do virus (VP_VR)
- KĐ tính chuẩn của DL bằng phép kiểm Shapiro-Wilk có kết quả trong bảng
5
Bảng 5. Kết quả KĐ tính chuẩn của DL bằng phần mềm SPSS
a Sig. * .200P * .200P
Kolmogorov-SmirnovP Statistic df 10 VP_VT .116 10 VP_VR .147 Shapiro-Wilk Statistic df 10 .968 10 .969 Sig. .875 .883
Kết quả KĐ cho thấy hàm lượng CRP của nhóm viêm phổi do vi trùng và do
virus đều có PPC (p > 0,05)
A: Hai phương sai đồng nhất 0E
* KĐ tính đồng nhất của phương sai với giả thuyết HA
=
=
F
A(9; 9) = 3,178 (p = 0,285) nên hai phương sai đồng
A0,05A
29, 6 20, 044
2 s 1 2 s 2
A E = 1,476 < FE
nhất
* So sánh sự khác biệt về hàm lượng CRP trung bình giữa hai nhóm:
A ≤ µA A: µA 1E 0E
A; HA 2E
A: µA 1E
A > µA 1E
A 2E
−
−
+
(
1)
(
n 1
2 s 2
2 σ
=
Đặt giả thuyết một đuôi: HA
2 s 1 +
n 2 − 2
1) n 1
n 2
−
− 12, 6 8, 6
x 2
=
=
t
= 24,822
0,05(18) = 1,734 nên bác bỏ H
0 (p =
σ
+
24,822
1 1 + 10 10
x 1 1 n 1
1 n 2
= 1,795 > t
0,0447)
Kết luận: Nồng độ CRP của nhóm viêm phổi do vi trùng cao hơn nồng độ
CRP của nhóm viêm phổi do virus.
4. Ứng dụng của đường cong ROC
Trong y học, một xét nghiệm được coi là hoàn hảo nếu xét nghiệm đó phân
biệt rõ hai trạng thái có bệnh hoặc không bệnh đối với một cá nhân nhưng trong
thực tế hiếm có một xét nghiệm nào như thế. Đối với một bệnh mà có thể sử dụng
nhiều xét nghiệm để giúp chẩn đoán, việc lựa chọn xét nghiệm nào tối ưu là một
vấn đề rất quan trọng đối với bác sĩ. Để giải quyết vấn đề này, ngoài phương pháp
mô hình ngưỡng, người ta còn sử dụng đường cong ROC (Receiver Operating
Characteristic).
Theo Nguyễn Ngọc Rạng (2012), khái niệm đường cong ROC xuất phát từ lý
thuyết phát tín hiệu và đã được sử dụng trong thế chiến thế giới lần thứ hai.
Căn cứ vào DL thu thập được, máy sẽ vẽ đường cong ROC. Dựa vào đường
cong này, người quan sát xác định tín hiệu nào là thật (do máy bay bay địch tạo ra),
tín hiệu nào là giả (do nhiễu). Từ năm 1970, khái niệm đường cong ROC được sử
dụng trong y học để xác định điểm cắt của các biến định lượng nhị phân
(bệnh/không bệnh) tốt nhất, tức là xác định ngưỡng có độ nhạy và độ chuyên cao
nhất. Mỗi điểm trên đường cong ROC ứng với tọa độ Oxy, với (x ; y) = (ss ; 1-sp).
Đường cong càng lệch về phía trên bên trái của trục tọa độ thì sự phân biệt hai trạng
thái càng rõ.
Nếu sử dụng XS để chẩn đoán, trước hết ta cần tìm điểm cắt bằng chỉ số
Youden (J) và vẽ đường cong ROC để xác định nồng độ CRP nào có độ nhạy (ss)
i dương tính nếu CRP > c
i và
Đặt các xét nghiệm T và độ chuyên (sp) cao nhất, với J = max(ss + sp - 1). i để chẩn đoán như sau: T
âm tính nếu ngược lại.
Bảng 6 trình bày các mức CRP dùng để xác định điểm cắt. Dùng chỉ số
Youden (ký hiệu J) để xác định nồng độ CRP nào có độ nhạy và độ chuyên cao
nhất. Như vậy, cần chọn ss và sp sao cho J lớn nhất.
Bảng 6. Các mức CRP
CRP B- 1-sp J=ss+sp-1 B+ ss sp
10 1 1 0 1 0 0
10 2.5 1 0.1 0.9 1 0.1
9 3.5 0.9 0.2 0.8 2 0.1
9 4.5 0.9 0.4 0.6 4 0.3
9 5.5 0.9 0.6 0.4 6 0.5
8 6.5 0.8 0.6 0.4 6 0.4
8 7.5 0.8 0.7 0.3 7 0.5
8 8.5 0.8 0.8 0.2 8 0.6
8 9 0.8 0.8 0.2 8 0.6
8 9.5 0.8 0.8 0.2 8 0.6
7 10.5 0.7 0.8 0.2 8 0.5
6 11.5 0.6 0.8 0.2 8 0.4
5 12.5 0.5 0.8 0.2 8 0.3
4 13.5 0.4 0.8 0.2 8 0.2
4 14.5 0.4 0.9 0.1 9 0.3
3 15.5 0.3 0.9 0.1 9 0.2
3 16.5 0.3 0.9 0.1 9 0.2
2 17.5 0.2 0.9 0.1 9 0.1
2 18.5 0.2 1 0 10 0.2
1 19.5 0.1 1 0 10 0.1
0 20.5 0 1 0 10 0
Đường cong ROC như hình 6:
Hình 6. Đường cong ROC về xét nghiệm chỉ số CRP
Vậy chọn CRP = 9 là điểm cắt vì tại đây, chỉ số J lớn nhất tương ứng với độ
nhạy ss = 0,8 và độ chuyên sp = 0,8
(CRP > 9) (CRP < 9)
Sau khi có điểm cắt ta có DL trong bảng 7:
Tổng 10 10 20
B- 2 8 10
PV + =
Bảng 7. xét nghiệm có độ nhạy và độ chuyên cao nhất B+ 8 2 10 T+ T- Tổng
8 10
= 0,8 ⇒ Nếu một đối tượng đến từ dân số có nồng độ CRP trung bình =
14,5 (ứng với trường hợp xét nghiệm CRP dương tính) thì khả năng đối tượng đó bị
viêm phổi do vi trùng là 80 %. Bác sĩ nên điều trị theo hướng viêm phổi do vi trùng.
Để biết quyết định điều trị của bác sĩ đúng hay sai cần sử dụng mô hình ngưỡng P-
K.
AγE = 0,75.
t = 0,25 và TE
A Trong mô hình này, chọn ngưỡng xét nghiệm là T
(Xem hình 7)
Hình 7. Mô hình ngưỡng trong quyết định lâm sàng
+
+
=
=
(
/
)
PV
+ P B T
Vì đối tượng có CRP = 14,5 thuộc nhóm có kết quả xét nghiệm dương tính.
khi xét nghiệm dương tính là
8 10
Do đó, khả năng bị B+ = 0,8 >
0,75 thuộc vùng điều trị. Với kết quả này, bác sĩ cho điều trị là đúng.
5. Ba bài toán cơ bản của thống kê trong y học
Các nghiên cứu trong y học có thể có nhiều lĩnh vực khác nhau như đánh giá hiệu
quả của một loại thuốc mới hoặc một phương pháp điều trị mới, thử nghiệm
vaccine, khảo sát sự tương quan giữa một yếu tố nguy cơ và một bệnh nào đó, …
Có nhiều phương pháp nghiên cứu để đánh giá điều này như nghiên cứu lâm
sàng đối chứng ngẫu nhiên, nghiên cứu bệnh - chứng, nghiên cứu đoàn hệ, …
nhưng phương pháp chung của các nghiên cứu đều phải trải qua các bước sau đây:
- Xác định cỡ mẫu: Mỗi loại hình nghiên cứu đều có phương pháp xác định cỡ
mẫu khác nhau và công việc này phải thực hiện đầu tiên trong nghiên cứu.
- Thu thập DL trong quần thể các đối tượng nghiên cứu, phân thành hai nhóm
nếu nghiên cứu đối chứng hoặc nhiều nhóm trong các nghiên cứu khác.
- Tiến hành phân tích DL bằng các phương pháp thống kê như ước lượng
khoảng tin cậy, KĐ giả thuyết thống kê hoặc phương pháp hồi quy tương quan,…
a. Xác định cỡ mẫu
Thông thường, việc tính cỡ mẫu phải dựa vào các thông số sau đây:
- Sai lầm loại 1 (α): Phương pháp KĐ dẫn đến kết luận hai nhóm có sự khác biệt
nhưng thực sự chúng không có sự khác biệt.
- Sai lầm loại 2 (β): Phương pháp KĐ dẫn đến kết luận hai nhóm không khác biệt
nhưng thực sự chúng có sự khác biệt.
Thông thường, một nghiên cứu chấp nhận sai lầm loại 1 khoảng 1% hay 5%
và sai lầm loại 2 khoảng 0,1 đến 0,2 (Nguyễn Văn Tuấn, 2007)
- Độ khác biệt trong dân số của biến phụ thuộc. Nếu biến phụ thuộc là biến số liên
tục (huyết áp, chiều cao, cân nặng, …) thì độ khác biệt là một giá trị. Nếu biến phụ
thuộc là biến nhị phân (có 2 trạng thái) thì độ khác biệt này là tỷ lệ %.
- Các thông số khác như tỷ lệ lưu hành trong nghiên cứu cắt ngang, tỷ số OR trong
nghiên cứu bệnh - chứng, nguy cơ tương đối RR trong nghiên cứu đoàn hệ,…
Có thể tóm lược phương pháp chọn mẫu theo các bài toán TK như sau:
* Nếu nghiên cứu trên một nhóm đối tượng
- Ước tính chỉ số trung bình: Thường sử dụng đối với các biến liên tục như chiều
cao, cân nặng, huyết áp, acid uric, cholesterol, hồng cầu, bạch cầu,…
Tính cỡ mẫu để ước tính chiều cao của đàn ông Việt Nam với sai số ∆ trong vòng 1
cm. Biết rằng độ lệch chuẩn trong các nghiên cứu trước đây là 4,6; α = 5% và β =
20%
Ví dụ 5
Theo phân phối chuẩn, với α = 5% thì ZE AαA
A = 1,96 và với β = 20% thì ZE A = 1,04 AβA
Z
Z
α
2
=
βσ
Thay vào công thức tính cỡ mẫu:
= 190,44
n
+ 2
∆
Vậy cỡ mẫu tối thiểu là n = 190. (Nguyễn Ngọc Rạng, 2012, tr.69)
A E A E
- Ước tính cỡ mẫu cho một tỷ lệ: Trong trường hợp này, phương pháp tính cỡ mẫu
tùy thuộc vào mức độ đã biết thông tin về quần thể hay chưa.
Ví dụ 6. Điều tra về tình hình nhiễm HIV ở người tiêm chích ma túy.
a. Nếu muốn sai số ước lượng không quá e = 2 % ở độ tin cậy 95% thì cỡ mẫu tối
thiểu bằng bao nhiêu?
2
2
=
n
Trường hợp này chưa có mẫu khảo sát, độ tin cậy γ = 0,95 ⇒ α = 1 - γ = 0,05
1,96 2 2
= ×
α Z 2 e
= 2401 ⇒ Zα= 1,96. Áp dụng công thức tính cỡ mẫu
b. Điều tra trên 423 người tiêm chích ma túy thấy có 17 người bị nhiễm HIV. Muốn
sai số ước lượng không quá e = 2% ở độ tin cậy 95% thì cỡ mẫu tối thiểu bằng bao
nhiêu?
2
2
=
×
−
=
×
n
p
(1
p
)
− 0, 04(1 0, 04)
Trường hợp này đã có mẫu khảo sát, công thức tính cỡ mẫu là
1,96 2
α Z e
= 368,79
(với p = 17/423 = 0,04 là tỷ lệ nhiễm HIV trong mẫu điều tra)
Như vậy cần lấy tối thiểu 368 người.
Ví dụ 7. Đề tài “Nghiên cứu đặc điểm gây mê hồi sức trong phẫu thuật nội soi ruột
thừa có bơm thán khí vào ổ bụng” (Lê Quang Sơn, 2009)
2
=
×
n
− 0,17(1 0,17)
Theo bài báo, trong phẫu thuật nội soi, rối loạn nhịp tim gặp khoảng 17% trường
A216,82.
1,96 0, 05
hợp, với độ tin cậy 95% thì cỡ mẫu tối thiểu là: =A E
Như vậy cần tối thiểu 217 trường hợp.
* Nếu nghiên cứu trên hai nhóm đối tượng
• Cỡ mẫu trong nghiên cứu lâm sàng đối chứng ngẫu nhiên:
Nghiên cứu lâm sàng đối chứng ngẫu nhiên thường được sử dụng để đánh giá
hiệu quả của một phương pháp điều trị hoặc hiệu quả của một loại thuốc mới. Đây
là phương pháp nghiên cứu có giá trị nhất trong y học chứng cứ.
Đối với các loại biến phụ thuộc khác nhau thì phương pháp tính cỡ mẫu cũng
khác nhau:
- Nếu biến phụ thuộc là biến nhị phân (có hai trạng thái đối lập nhau: Tử
2
−
+
−
+
−
Z
p 2 (1
p
)
Z
(1
)
(1
)
+
α 2
p 1
p 2
p 2
p 1
p 2
vong/không tử vong, khỏi bệnh/ không khỏi bệnh,…) thì công thức tính cỡ mẫu là
=
n
p
A, ZA AαA
A được
2E
AβA 2E
−
2
β 2 p 1
p 1 p 2
=
A E A E A E A E với và ZA
A = 1,96 và với β = 10% thì ZA AαA
A = 1,28 AβA
2E
2E
A E A E A E A E tính theo PPC. Chẳng hạn α = 5% thì ZA
Một nghiên cứu muốn đánh giá về hiệu quả của phương pháp mới trong điều trị khối u
ác tính ở da. Với phương pháp điều trị trước đây, tỷ lệ sống sót sau 5 năm là 60%.
Người ta ta hy vọng tỷ lệ sống sót sau 5 năm khi điều trị bằng phương pháp mới tăng
thêm 20%. Cần bao nhiêu bệnh nhân trong mỗi nhóm với sai sót α = 5% và sai sót β =
10%.
+
p 1
p 2
Ví dụ 8
=
=
AβA
Với α = 5% thì ZA
A = 1,28;
=
A = 1,96 và với β = 10% thì ZA AαA 2E 2E
p
2
+ 0, 6 0,8 2
0,7
Biến phụ thuộc trong trường hợp này là biến nhị phân (sống/ chết) nên cỡ mẫu
2
×
−
+
−
+
−
là
n
A E A E A E A E
1,96 2 0, 7(1 0, 7) 1, 28 0, 6(1 0, 6) 0,8(1 0,8) − 0, 6 0,8
=
= 108
Như vậy cần chọn 108 người vào mỗi nhóm và tổng cộng là 216 người cho hai nhóm.
(J. Bénichou et al, 2009, tr.289)
2
+
Z
Z
α 2
2
=
β σ ×
n
2
- Nếu biến phụ thuộc là biến liên tục (huyết áp, cholesterol, acid uric, …) thì công
∆
với ∆ là độ khác biệt giữa nhóm thực thức tính cỡ mẫu là
nghiệm và nhóm chứng.
So sánh hai loại thuốc điều trị tăng huyết áp, loại thuốc mới B (nhóm thực nghiệm)
làm giảm trị số huyết áp tâm thu hơn thuốc cũ A (nhóm chứng) là 10 mmHg. Các điều
tra trong dân số trước đây cho biết độ lệch chuẩn của phân phối trị số huyết áp tâm thu
là 10 mmHg. Tính cỡ mẫu cho nghiên cứu này với α = 5% và β = 10%.
2
=
×
n
2
10
Ví dụ 9
+ 1,96 1, 28 10
(Nguyễn Ngọc Rạng, 2012, tr.70)
= 20,995, tức là cần tối thiểu 21 người trong mỗi nhóm
• Cỡ mẫu trong nghiên cứu bệnh - chứng
Nghiên cứu này được dùng để xác định sự liên hệ giữa một yếu tố nhất định và
một bệnh nhất định bằng cách so sánh tỷ lệ giữa 2 nhóm: nhóm có bệnh (nhóm phơi
nhiễm yếu tố nguy cơ) và nhóm không bệnh (nhóm chứng hoặc nhóm không phơi
nhiễm yếu tố nguy cơ). Để tìm cỡ mẫu cho mỗi nhóm trong nghiên cứu này, nhà
nghiên cứu cần xác định tỷ số OR hoặc nguy cơ tương đối RR.
Ví dụ 10. Một nghiên cứu cho biết tỷ lệ hút thuốc trong dân số là 20% và nguy cơ
mắc bệnh ung thư phổi trong nhóm hút thuốc cao gấp 4 lần (OR = 4) so với nhóm
=
×
OR
không hút. Tính cỡ mẫu cho nghiên cứu này với α = 5% và β = 10%.
A và pA 1E
A = 0,2 là tỷ lệ hút thuốc trong nhóm bệnh và 2E
− −
1 1
p 1 p 2
p 2 p 1
+
p 1
p 2
=
p
Ta có = 4, gọi pA
= 0,35
A = 0,5 nên 1E
2
nhóm chứng tương ứng thì pA
A = 1,96 và với β = 10% thì ZA
A = 1,28
AαA 2E
AβA 2E
2
−
+
−
+
−
n
A E A E A E A E α = 5% thì ZA
1,96 2(1 0,35) 1, 28 0,5(1 0,5) 0, 2(1 0, 2) − 0,5 0, 2
=
= 51 Tính được
• Cỡ mẫu trong nghiên cứu đoàn hệ
Nghiên cứu này dùng để xác định nguyên nhân gây bệnh và được chia thành 3
loại: Hồi cứu, tương lai và kết hợp giữa hồi cứu và tương lai.
Để tính cỡ mẫu cho nghiên cứu này, nhà nghiên cứu cần phải biết nguy cơ tương
đối RR.
Ví dụ 11. Một nghiên cứu đoàn hệ tương lai để tìm nguyên nhân gây bệnh ung thư
phổi trên 2 đoàn hệ có các đặc điểm giống nhau và lành bệnh tại thời điểm nghiên
cứu. Hai đoàn hệ này chỉ khác nhau về yếu tố phơi nhiễm (hút thuốc lá và không
hút thuốc lá). Theo dõi 2 đoàn hệ này trong vòng 10 năm, các nghiên cứu trước đây
=
RR
cho biết RR = 2 và tỷ lệ hút thuốc trong dân số là 20%.
A = 0,2 là tỷ bệnh trong nhóm hút thuốc và nhóm A và pA 2E 1E
p 1 p 2
+
p 1
p 2
=
p
= 0,3
Ta có = 2 với pA
A = 0,4 nên 1E
2
không hút thuốc tương ứng thì pA
A = 1,96 và với β = 10% thì ZA
A = 1,28
AαA 2E
AβA 2E
A E A E A E A E α = 5% thì ZA
Tính được cỡ mẫu trong nghiên cứu này là n = 108
Vậy phải lấy 108 người trong mỗi nhóm.
Ví dụ 12. Một nghiên cứu đoàn hệ hồi cứu “Kết cục của bệnh nhân bị viêm phổi có
hạ natri máu: một nghiên cứu đoàn hệ hồi cứu” (Marya D Zilberberg et al., 2008)
A = 0,054 và của 1E
nhóm không hạ natri máu pA A = 0,04. Tác giả đã chứng minh được giả thuyết: “Bệnh 2E
cho biết tỷ lệ tử vong tại bệnh viện của nhóm hạ natri máu là pA
nhân viêm phổi điều trị tại bệnh viện có hạ natri máu có tỷ lệ tử vong cao hoặc nặng
2
−
+
−
+
−
Z
p 2 (1
p
)
Z
(1
)
(1
)
α 2
p 1
p 2
p 2
n
hơn so với bệnh nhân không hạ natri máu”. Với mức α = 5% và với β = 10%, cỡ
−
β 2 p 1
p 1 p 2
=
mẫu cho nghiên cứu này là = 6798
bệnh nhân. Như vậy mỗi nhóm cần 6798 bệnh nhân.
• Cỡ mẫu trong nghiên cứu tương quan.
n
= + 3
2
×
log
1 1
α β ) , + 1 − 1
R R
R 0 R 0
4 ( Z + −
Công thức tính cỡ mẫu là
A = 0. 0E
Nếu nghiên cứu thực hiện trên một nhóm thì RA
Ví dụ 13. Một nghiên cứu tìm hiểu sự liên quan giữa hàm lượng iod trong nước
uống (µg/l) và tỷ lệ % bệnh bướu cổ. Các nghiên cứu đã thực hiện trước đây cho
biết hệ số tương quan giữa hàm lượng iod và tỷ lệ bệnh bướu cổ là R = - 0,8. Tính
= + 3
n
cỡ mẫu cho nghiên cứu này với α = 5%, β = 10% và Z(α,β) = 10,51.
2
log
× 4 10,51 − 1 0,8 + 1 0,8
Thay vào công thức tính cỡ mẫu thì = 49,168
Vậy cần lấy 50 người trong nghiên cứu này.
b. Ước lượng khoảng tin cậy và KĐ giả thuyết thống kê
2σ
* Ước lượng khoảng tin cậy và KĐ giả thuyết thống kê về số trung bình
• Trường hợp một mẫu: đã biết phương sai
−
µ
1
=
u
N
~
(0,1)
Với độ tin cậy γ, tìm hằng số C sao cho γ = P(-C ≤ u ≤ C) = 2φ(C) - 1 ⇒ φ(C)
x σ
γ+ 2
n
/
σ
C
µ= ±
x
= được tìm theo PPC, với
n
2sσ ≅ 2
⇒ khoảng tin cậy cho trung bình là :
Khi cỡ mẫu n ≥ 30 thì lấy
Trong trường hợp này để so sánh trung bình mẫu thực nghiệm x và trung bình
lý thuyết µ, các bước thực hiện là:
A: Không có sự khác biệt giữa x và µ 0E
−
µ
=
u
Đặt giả thuyết HA
x σ
/
n
và tìm p-value = P(|U| > u) theo PPC. Tính giá trị của
Sử dụng p_value (p giá trị) để quyết định sự khác biệt có ý nghĩa TK hay
không theo quy tắc: Nếu p < 0,05 thì sự khác biệt có ý nghĩa TK, nếu p > 0,05 thì sự
khác biệt không có ý nghĩa TK.
Có thể minh họa cách tính giá trị p thông qua một bài toán giả định sau đây:
Điều trị 20 bệnh nhân bằng hai loại thuốc A và B. Sau một thời gian theo dõi, có 15
bệnh nhân có kết quả điều trị bằng thuốc A tốt hơn so với thuốc B. Có thể kết luận
thuốc A tốt hơn thuốc B không?
HA A: Hiệu quả của thuốc A và B như nhau 0E
Để giải quyết bài toán này, giả thuyết TK là:
A: Hiệu quả của thuốc A tốt hơn so với thuốc B. AE
HA
A 0E
Gọi X là số bệnh nhân khỏi bệnh khi điều trị bằng thuốc A hoặc B. Nếu HA
−
x
20
x
20
=
=
×
× −
=
×
(
)
0,5
(1 0,5)
0,5
P X x
C
C
x 20
x 20
đúng, thì X có phân phối nhị thức với hàm mật độ XS là:
20
20
≥
=
P X (
15)
0,5
XS để có tối thiểu 15 bệnh nhân có kết quả điều trị bằng thuốc A tốt hơn so
x 20
×∑ C
x
= 15
0, tức là ta có đủ bằng chứng để khẳng
với thuốc B là = 0,02 = p.
A: Hiệu quả của thuốc A tốt hơn so
Vì p < 0,05 nên đủ cơ sở để bác bỏ H định rằng kết quả KĐ phù hợp với giả thuyết H
với thuốc B.
Đối với các phép kiểm khác nhau, cách tính p cũng khác nhau. Tuy nhiên, các
2σ , cỡ mẫu n < 30
phần mềm máy tính đều có thủ tục để xác định giá trị này.
• Trường hợp một mẫu: chưa biết phương sai
Khi n < 30 sẽ có hai khía cạnh thay đổi:
- Độ lệch chuẩn của mẫu dễ bị tác động bởi các biến thiên lấy mẫu, có thể không
phải là ước lượng đáng tin cậy của s.
- Khi dân số không có PPC, trung bình mẫu có thể cũng không có PPC
Đây là kết quả của định lý giới hạn trung tâm, khi cỡ mẫu lớn thì DL sẽ có
khuynh hướng tuân theo PPC. Trong trường hợp cỡ mẫu nhỏ, DL lấy từ dân số có
PPC, người ta sẽ dùng phân phối t (student) để thay thế cho PPC.
A(n-1)
A1-γA
µ−
=
µ= ±
t
~
Student n
(
1)
x
A E Cho trước độ tin cậy γ, tìm hằng số C sao cho γ = P(-C ≤ t ≤ C) ⇒ C = tE
− ⇒ khoảng tin cậy cho trung bình là :
x s /
n
Cs n
Với
Để so sánh trung bình mẫu thực nghiệm và trung bình lý thuyết µ, đặt giả
A: Không có sự khác biệt giữa x và µ 0E
µ−
=
t
thuyết HA
x / s
n
và tìm p-value = P(|T| > t) và kết luận sự khác biệt Tính giá trị của
có ý nghĩa TK hay không.
Đo chiều cao X (cm) của 24 bé trai 2 tuổi ở Jamaica mắc bệnh hồng cầu liềm đồng
hợp tử như sau: 84.4, 89.9, 89, 87, 78.5, 84.1, 86.3, 80.6, 80, 81.3, 86.8, 83.4, 89.8,
85.4, 80.6, 85, 82.5, 80.7, 84.3, 85.4, 85, 85, 85.5, 81.9
Tính được A XE = 84,1 ; s = 3,11. Theo tiêu chuẩn về chiều cao và trọng lượng của
Anh, bé trai 2 tuổi có chiều cao là 86,5. Có thể kết luận rằng bé trai bị bệnh hồng cầu
liềm có chiều cao khác tiêu chuẩn không ? (Betty R. Kirwood, 2003)
Ví dụ 14
0 : Chiều cao trung bình của bé trai 2 tuổi mắc bệnh hồng cầu
Đặt giả thuyết H
liềm là 86,5 cm.
2σ chưa biết nên tác giả sử
µ−
=
=
t
24
Trong nghiên cứu này, n = 24 < 30 và phương sai
− 84,1 86,5 3,11
n
x s /
dụng phép kiểm t với = -3,81 với p < 0,001, dẫn đến kết
luận chiều cao trung bình của bé trai người Jamaica bị bệnh hồng cầu liềm thấp hơn
có ý nghĩa so với tiêu chuẩn của Anh.
Sau khi đưa ra kết luận này, tác giả có lưu ý « cẩn thận khi lý giải kết quả vì sự
phát triển của trẻ em bị bệnh hồng cầu liềm Jamaica được so sánh với tiêu chuẩn
của Anh chứ không phải tiêu chuẩn Jamaica với trẻ khỏe mạnh. Có thể là bệnh hồng
cầu liềm làm còi sự phát triển nhưng cần phải so sánh với trẻ Jamaica không bệnh
để khẳng định điều này »
Trong phép kiểm t ở trên, điều kiện tiên quyết là DL về chiều cao thu thập
được từ 24 trẻ em Jamaica phải có PPC nhưng trong phần KĐ của tác giả không đề
cập đến điều kiện này mà mặc định coi DL này có PPC.
2 2 ,σ σ 1 2
• Trường hợp hai mẫu : đã biết phương sai
=
−
2 σ σ + 2
x 1
± x C 2
µ µ− 2
1
2µ µ−
1
2 1 n 1
n 2
2
2
khoảng tin cậy cho là
1 ≥ 30 và n
2 ≥ 30 thì lấy
1sσ =
2 1
2sσ =
2 2
và . Nếu n
Ví dụ 15. Nghiên cứu sự khác biệt về nồng độ acid uric trong huyết thanh ở bệnh
nhân không có và bệnh nhân có hội chứng down. Nhóm 1 gồm 12 trẻ có hội chứng
down được chọn từ một bệnh viện điều trị trẻ chậm phát triển trí tuệ. Nhóm 2 gồm
1x = 4,5/100ml,
2x = 3,4/100ml.
15 trẻ có cùng tuổi và phái với nhóm 1. Kết quả :
1,5
Biết rằng trong hai dân số trên, nồng độ acid uric có PPC với phương sai lần lượt là 1E - µ 1 và 1,5. Tìm khoảng tin cậy 95% cho µ 2E
1σ = và
2 1
2 σ = 2
1
Đây là trường hợp phương sai đã biết : và với độ tin cậy γ
γ+ 2
= 8,9 ± 4,0085 = [4,8915 ; 12,9085]
= 0, 95 thì φ(C) = = 0,975 ⇒ C = 1,96 theo PPC.
2µ µ−
1
Từ đó, khoảng tin cậy là
1E > µ 2E
khoảng tin cậy này các biệt 0 rất lớn nên có bằng chứng để khẳng định µ
, tức là nồng độ trung bình của acid uric ở trẻ có hội chứng down lớn hơn so với
nồng độ này ở trẻ bình thường.
Phương pháp KĐ giả thuyết TK cũng được sử dụng để khẳng định DL thu
thập được có đủ bằng chứng để kết luận có sự khác biệt về nồng độ acid uric giữa
trẻ bình thường và trẻ có hội chứng down hay không, phép kiểm u sẽ được sử dụng
như sau :
0 : µ
1E = µ
2E và H
1 : µ
1E ≠ µ
2E
−
2
x 1
x
=
u
Đặt giả thuyết H
0 (p = 0,102)
2 2 σ σ + 1 2 n n 2 1
Tính = 2,569 ⇒ |u| > 1,96 nên bác bỏ H
Kết luận : Nồng độ acid uric trung bình của trẻ bình thường và trẻ có hội
chứng down khác nhau có ý nghĩa.
Trong một số nghiên cứu, mặc dù chưa biết phương sai hai nhóm trong dân số
nhưng do lấy mẫu có cỡ n > 30 nên có thể lấy phương sai dân số bằng phương sai
mẫu khi thực hiện phép KĐ.
Ví dụ 16. Đề tài « Nghiên cứu nồng độ Homocysteine máu, yếu tố nguy cơ mới ở
bệnh nhân nhồi máu não cấp » (Nguyễn Đức Hoàng, 2004)
Nghiên cứu này được thực hiện bằng phương pháp nghiên cứu bệnh - chứng.
Nhóm bệnh gồm 50 bệnh nhân được chẩn đoán nhồi máu não cấp đang điều trị tại
bệnh viện có nồng độ Homocysteine (Hcy) trung bình là 18,99 ± 9,2 và nhóm
chứng gồm 50 người khỏe mạnh có nồng độ Hcy trung bình là 11,86 ± 2,4. Sau khi
so sánh hai trung bình thực nghiệm trong 2 nhóm độc lập, các tác giả kết luận nồng
độ Hcy máu ở nhóm nhồi máu não cấp cao hơn hẳn nhóm chứng và sự khác biệt có
,σ σ , cỡ mẫu n
ý nghĩa TK (p < 0,001).
• Trường hợp hai mẫu: chưa biết phương sai
1 < 30 hoặc
2 1
2 2
n 2 < 30
Trong trường hợp này, DL hai mẫu thực nghiệm phải có PPC và phương sai
hai dân số đồng nhất, nếu vi phạm điều kiện này thì kết luận đưa ra có thể không
đáng tin cậy.
Ví dụ 17. Đề tài “Bước đầu khảo sát tăng đông trên bệnh nhân huyết khối tắc
mạch” (Huỳnh Thị Thanh Trang, 2008)
Trong đề tài này, tác giả so sánh Hcy trung bình giữa 2 nhóm huyết khối động
mạch và tĩnh mạch, số liệu trong bảng 8
Bảng 8. Lượng Hcy trung bình
Thực hiện phép kiểm t để so sánh hai trung bình với điều kiện DL có PPC và
−
x 2
=
t
phương sai đồng nhất dẫn đến kết luận Hcy trung bình nhóm huyết khối động mạch
+
σ
x 1 1 n 1
1 n 2
cao hơn nhóm huyết khối tính mạch với (p = 0,0055)
* Ước lượng khoảng tin cậy và KĐ giả thuyết thống kê về tỷ lệ
• Trường hợp một mẫu
1
=
u
Cho trước độ tin cậy γ, tìm hằng số C sao cho γ = P(-C ≤ u ≤ C) = 2φ(C) - 1 ⇒
γ+ 2
f p
)
− p − p (1 n
f
f
)
= ±
p
f C
φ(C) = được tìm theo PPC, với ~N(0;1), f là tỷ lệ thực nghiệm
− (1 n
trong mẫu n phần tử. khoảng tin cậy cho tỷ lệ là :
p−
• Trường hợp 2 mẫu
p 1
2
−
−
f
f
)
)
1
f 1
f 1
2
2
−
=
−
+
p
là: Cho trước độ tin cậy γ, khoảng tin cậy cho
p 1
2
f 1
± f C 2
γ+ 2
(1 n 1
(1 n 2
với φ(C) =
1, f
2 là tỷ lệ thực nghiệm trong mẫu 1 và mẫu 2 tương ứng.
và f
p=
p≠
phép kiểm u được dùng để KĐ sự khác biệt giữa hai tỷ lệ như sau:
0:
1:
p 1
2
p 1
2
−
f
f 1
2
=
u
Đặt giả thuyết H và H
0 đúng thì
−
+
f
(1
f
)
1 n 1
1 n 2
Nếu H ~ N(0;1)
1f ≥ 5; n
2f ≥ 5 và 0,1 < f < 0,9
Điều kiện để thực hiện phép kiểm này là n
Tính p = P(|U| > u) và kết luận sự khác biệt có ý nghĩa nếu p < 0,05.
Ví dụ 18. (Kenneth W. Lyles, et al, 2007)
Một nghiên cứu lâm sàng đối chứng ngẫu nhiên mù đôi về hiệu quả ngừa gãy
xương của thuốc Zoledzonate, các nhà nghiên cứu đã tuyển chọn 2127 bệnh nhân và
chia thành 2 nhóm. Nhóm 1 gồm 1062 bệnh nhân được điều trị bằng thuốc
Zoledzonate (liều 5mg) và nhóm 2 (nhóm chứng) gồm 1062 bệnh nhân cho uống
canxi và vitamin D. Sau 3 tháng theo dõi, kết quả như sau : Nhóm 1 có 92 bệnh
nhân và nhóm 2 có 148 bệnh nhân bị gãy xương đốt sống. Tác giả kết luận thuốc
Zoledzonate có tác dụng làm giảm tỷ lệ gãy xương đốt sống.
Để KĐ kết luận này, có thể sử dụng 2 phương pháp sau đây :
- Ước lượng khoảng tin cậy cho hiệu hai tỷ lệ
=
f
f = 1
f = 2
148 1065
+ 92 48 + 1062 1065
92 1062
p−
p−
= 0,0886; = 0,1389 ; = 0,1128
p 1
2
p 1
2
là = - 0,0503 ± 0,0268 = [-0,0771; -0,0235] khoảng tin cậy 95% cho
< 0 nên có thể kết luận thuốc Zoledzonate có tác dụng làm giảm tỷ lệ gãy xương đốt
sống.
p=
p<
Kết luận này có thể được khẳng định dựa vào phép kiểm u như sau:
0 :
1:
p 1
2
p 1
2
Đặt giả thuyết H và H
Tính được u = -3,666, p (hai đuôi) < 0,002 và p (1 đuôi) < 0,001 nên có thể kết luận
sự khác biệt có ý nghĩa TK và chứng tỏ thuốc Zoledzonate có tác dụng làm giảm tỷ
lệ gãy xương đốt sống.
* Khoảng tin cậy cho RR và OR
Đây là hai chỉ số KĐ mối liên hệ giữa một yếu tố nguy cơ và bệnh B.
Giả sử các đối tượng được chia thành 2 nhóm như bảng 9
Bảng 9. Bảng dữ liệu giả định dùng để xác định RR và OR B- b d b + d Nhóm 1 Nhóm 2 Tổng cộng B+ a c a+ c Tổng cộng a + b = n 1 c + d = n 2 1 + n n = n 2
1 đối tượng bị phơi nhiễm một yếu tố nguy cơ và sau một thời
Nhóm 1: Gồm n
1 đối tượng mắc bệnh. Khi đó tỷ lệ mắc bệnh trong nhóm này là
=
p 1
k 1 n 1
gian theo dõi có k
2 đối tượng không bị phơi nhiễm yếu tố nguy cơ và sau một
Nhóm 2: Gồm n
2 đối tượng mắc bệnh. Khi đó tỷ lệ mắc bệnh
=
thời gian theo dõi như nhóm 1 có k
p 2
k 2 n 2
trong nhóm này là
=
RR
• Nguy cơ tương đối (Relative Risk, ký hiệu là RR)
p 1 p 2
RR được định nghĩa là tỷ số giữa hai tỷ lệ trên:
Vậy:
- Nếu RR > 1: yếu tố nguy cơ làm tăng khả năng mắc bệnh
- Nếu RR < 1: yếu tố nguy cơ làm giảm khả năng mắc bệnh
- Nếu RR = 1: Không có mối liên hệ giữa yếu tố nguy cơ và bệnh
khoảng tin cậy 95 % của RR được tính như sau:
- Tính khoảng tin cậy 95 % của ln(RR) theo công thức ln(RR) ± 1,96s = [x, y];
2s
2
=
+
s
/ a c + a c
/ b d + b d
trong đó là phương sai được tính theo công thức Greenwood với
;x y e e ]
- khoảng tin cậy 95 % cho RR là [
Ví dụ 19. X quang và ung thư vú
Trong một nghiên cứu lâm sàng đối chứng ngẫu nhiên được thực hiện tại Thụy
Điển, các nhà nghiên cứu tuyển các phụ nữ trên 50 tuổi và chia thành 2 nhóm.
Nhóm 1: Gồm 66103 phụ nữ được chụp X quang (mammography) hàng năm.
Nhóm 2: Gồm 66105 phụ nữ không chụp X quang mà chỉ theo dõi bình thường
(nhóm chứng)
Sau 5 năm, nhóm 1 có 183 người chết vì ung thư vú và nhóm 2 có 177 người
chết
Bảng 10 cho biết kết quả thống kê trong nghiên cứu sự liên quan giữa chụp
XQ và ung thư vú ở phụ nữ.
Bảng 10. Dữ liệu thống kê trong nghiên cứu về bệnh ung thư vú
Nhóm 1 Nhóm 2 Tổng cộng Tử vong 183 177 360 Không tử vong 65920 65928 131848 Tổng cộng 66103 66105 132208
=
RR
[Nguồn: Nguyễn Văn Tuấn, 2011b]
p = 1
p = 2
183 66103
177 66105
p 1 p 2
, , = 1,034
Kết luận: Nhóm chụp X quang thường xuyên có nguy cơ tử vong cao hơn
nhóm chứng khoảng 3,4%.
- khoảng tin cậy 95% cho log(RR) là:
+
+
/ a c + a c
/ b d + b d
183 /177 + 183 177
65920 / 65928 + 65920 65928
ln(RR) ± 1,96 = ln(1,034) ± 1,96
−
0,072
0,138
e
;
e
= 0,033 ± 0,105 = [-0,072; 0,138]
] = [0,931; 1,148] - khoảng tin cậy 95 % cho RR là: [
• Tỷ số chênh (Odds Ratio, ký hiệu là OR)
Khái niệm số chênh (odd) giữa hai biến cố diễn tả tỷ số giữa khả năng xảy ra
=
=
o
o
dd
của một biến cố và khả năng không xảy ra của biến cố đó. Vậy:
dd 1
2
1
1
p 2 − p 2
p 1 − p 1
=
=
×
=
OR
RR
Số chênh của nhóm 1 là và số chênh của nhóm 2 là
− −
− −
o dd 1 o dd
1 1
1 1
2
p 1 p 2
p 2 p 1
p 2 p 1
và
Từ đó:
- Nếu OR =1: Sự tương quan giữa yếu tố nguy cơ và bệnh không có ý nghĩa
- Nếu OR > 1: Yếu tố tương quan với bệnh là yếu tố nguy cơ
- Nếu OR < 1: Yếu tố tương quan với bệnh là yếu tố bảo vệ (vaccine)
1 và p
2 rất nhỏ) thì OR = RR và RR thường
Chú ý rằng với những bệnh hiếm (p
được sử dụng trong nghiên cứu đoàn hệ trong khi OR thường sử dụng trong nghiên
=
=
=
o
o
OR
cứu bệnh - chứng.
1dd
2dd
a = và b
c d
o dd 1 o dd
ad bc
2
Theo bảng 9 ta thấy rằng nên
khoảng tin cậy 95 % cho OR được tính như sau:
=
+ + +
s
- Tính khoảng tin cậy 95 % cho log(OR) theo công thức:
1 a
1 b
1 c
1 d
ln(OR) ± 1,96s = [l, m]; với
;l m e e ]
- khoảng tin cậy 95% cho OR là [
Từ đó:
- Nếu khoảng tin cậy chứa 1: Sự tương quan giữa yếu tố nguy cơ và bệnh không có
ý nghĩa TK.
- Nếu khoảng tin cậy < 1: Yếu tố tương quan với bệnh là yếu tố bảo vệ
- Khoảng tin cậy > 1: Yếu tố tương quan với bệnh là yếu tố nguy cơ
Ví dụ 20. HPV (Human papilloma virus) và ung thư cổ tử cung
) đến
Một nghiên cứu bệnh - chứng thực hiện tại một bệnh viện như sau: Nhóm bệnh: 30 bệnh nhân bị ung thư cổ tử cung (K+ ) Nhóm chứng: 60 sản phụ cùng độ tuổi không bị ung thư cổ tử cung (K-
sinh tại bệnh viện
Sau 3 năm theo dõi, dùng xét nghiệm CPR tìm HPV, nhóm bệnh có 22 người
và nhóm chứng có 10 người có HPV+
. Xem bảng 11
Tổng
có HPV+
Bảng 11. DL trong nghiên cứu ung thư cổ tử cung HPV- 8 (b) 50 (d) HPV+ 22 (a) 10 (c) 30 60
2 =
2 =
1 =
1 =
=
=
=
=
RR
4, 4
OR
Ta có: p K+ K- [Nguồn: Nguyễn Ngọc Rạng, 2012] ; odd ; odd ; p 22 8 10 50 22 30
ad bc
2
; = 13,75 10 60 o dd 1 o dd
p 1 p 2 Kết luận: Khả năng bị ung thư cổ tử cung ở phụ nữ nhiễm HPV cao gấp 13,75
lần ở phụ nữ không nhiễm HPV.
Để biết OR có ý nghĩa thống kê hay không ta tính khoảng tin cậy cho OR như
+ + +
sau:
1 a
1 b
1 c
1 d
- Tìm khoảng tin cậy 95% cho ln(OR) : ln(OR) ± 1,96
= 2,621 ± 0,895 ∈ [1,565; 3,677]
A; eE
A] = [4,783; 39,52]
1,565 E
3,677 E
A A A E A A A E - Hoán chuyển để tìm khoảng tin cậy cho OR: [eE
khoảng tin cậy này vượt quá 1 chứng tỏ yếu tố yếu tố nhiễm HPV là yếu tố nguy cơ.
6. Tương quan và hồi quy
a. Tương quan giữa hai biến định tính
- Biến số định tính là một đại lượng mà ta không thể cân, đong, đo, đếm được
mà chỉ thể hiện một đặc tính nào đó của đối tượng khảo sát. Chẳng hạn, đặc tính
giới tính (nam, nữ) là biến số định tính.
- Để khảo sát sự tương quan giữa 2 biến định tính ta so sánh sự khác biệt giữa
2 hay nhiều tỷ lệ bằng phép kiểm chi bình phương, Z, hoặc phép kiểm chính xác
Fisher.
Ví dụ 21: Một điều tra được thực hiện trên 500 bệnh nhân viêm phế quản kinh niên
và nhóm chứng gồm 500 người không mắc bệnh để khảo sát mối tương quan giữa
yếu tố nguy cơ “hút thuốc” và yếu tố bệnh “viêm phế quản kinh niên” có kết trong
bảng 12.
Bảng 12. Kết quả điều tra trong nghiên cứu bệnh viêm phế quản
Bệnh Không bệnh Tổng
Hút thuốc 320 200 520
Không hút thuốc 180 300 480
Tổng 500 500 1000
[Nguồn: Lê Trường Giang, 2007]
phép kiểm chi bình phương được thực hiện để khảo sát sự tương quan giữa
yếu tố nguy cơ “hút thuốc” và yếu tố bệnh “Viêm phế quản kinh niên”
Trong trường hợp này, ta cần so sánh tỷ lệ bệnh trong nhóm hút thuốc và tỷ lệ
bệnh trong nhóm không hút thuốc.
Đặt giả thuyết KĐ Ho: Không có sự khác biệt giữa 2 tỷ lệ này
2
−
2 χ
=
(Hoặc đặt Ho: Không có tương quan giữa yếu tố nguy cơ và bệnh)
1000(320.300 180.200) 500.500.520.480
= 57,692
Nếu lấy mức sai lầm loại 1 là α = 0,001, độ tự do df = 1, thì giá trị ngưỡng C
2 A > C nên bác bỏ Ho. Sự tương quan giữa yếu tố nguy cơ và bệnh có E
= 10,827. Vì χA
ý nghĩa TK.
Kết luận: Hút thuốc có thể là yếu tố nguy cơ gây bệnh viêm phế quản kinh
niên.
Ta có thể dùng phép kiểm u để so sánh hai tỷ lệ như sau:
−
f
f 1
2
=
u
−
+
(1
)
f
f
1 n 1
1 n 2
~ N(0;1)
f = 1
320 520
Với = 0,615 là tỷ lệ bệnh trong nhóm hút thuốc (nhóm phơi nhiễm
f = 2
180 480
yếu tố nguy cơ) và = 0,375 là tỷ lệ bệnh trong nhóm không hút thuốc
=
f
(nhóm không phơi nhiễm)
A = 480 A = 520; nA 2E 1E
+ 320 180 + 520 480
= 0,5 là tỷ lệ bệnh chung của 2 nhóm; nA
tính được u = 7,5955. Vì |u| lớn hơn giá trị tới hạn C = 2,58 (với α = 0,01) nên bác
bỏ Ho.
phép kiểm chi bình phương hoặc phép kiểm u chỉ cho biết có tương quan giữa
yếu tố nguy cơ và bệnh hay không, không cho biết độ mạnh của sự tương quan này.
Để biết độ mạnh của sự tương quan ta cần tính tỷ số chênh OR và khoảng tin cậy
=
=
=
OR
95% cho OR.
320.300 180.200
dd o 1 dd o
ad bc
2
+
+
= 2,6666
1 320
1 1 + 200 180
1 300
khoảng tin cậy 95% cho ln(OR) là: ln(2,6666) ± 1,96
= 0,98 ± 0,255 = [0,725; 1,235]
A; eE
A] = [2,064; 3,438]
0,725 E
1,235 E
A A A E A A A E ⇒ khoảng tin cậy 95% cho OR là [eE
khoảng tin cậy cho OR > 1 nên yếu tố tương quan với bệnh (hút thuốc) là yếu
tố nguy cơ.
Khi biết giá trị của KĐ chi bình phương, khoảng tin cậy 95% cho OR cũng được
± 1
1,96 57 ,692
1,96 2 Χ =
± 1 OR
2, 6666
tính theo công thức sau: (Lê Trường Giang, 2007)
= [2,07; 3,434]
b. Tương quan giữa một biến định tính và một biến định lượng.
- Biến định lượng là đại lượng có thể đo lường được, chẳng hạn: Chiều cao,
cân nặng, huyết áp,… của một cá nhân.
- Để khảo sát sự tương quan giữa một biến định tính và một biến định lượng ta
dùng các phép kiểm như u (nếu đã biết phương sai, hoặc mẫu lớn với n ≥ 30) hoặc
dùng phép kiểm t (phương sai chưa biết, cỡ mẫu n < 30, DL có PPC)
Ví dụ 22. Đo lượng cholesterol máu (X cg/l) của một mẫu gồm 100 bệnh nhân bị
bệnh B (nhóm 1) và một mẫu 100 người bình thường (nhóm 2). Kết quả trong bảng
13
160-169 170-179 180-189 190-199 200-209 210-219 220-229 230-239
Bảng 13. Lượng cholesterol của người bình thường và người bị bệnh B
3
5
12
30
20
20
8
2
X
4
6
25
28
20
14
2
1
Nhóm 1
Nhóm 2
Khảo sát xem có sự tương quan giữa biến số định tính (bệnh, không bệnh) và
biến số định lượng (lượng cholesterol) hay không?
=
=
=
100;
200, 6;
15,102
Kết quả tính các tham số mẫu như sau:
x 1
s 1
=
=
=
100;
195, 4;
14, 005
Nhóm 1: 1 n
n 2
x 2
s 2
Nhóm 2:
0: µ
A: µ
1≠ µ
2 .
=
=
u
2,524
Đặt giả thuyết H
0, ta có
1= µ 2 và H − x x 2 1 2 2 σ σ + 2 1 n n 2 1
Theo H
Lấy α = 0,05 thì giá trị tới hạn C = 1,96 nên |u| > C, Ho bị bác bỏ
Kết luận: Có sự tương quan giữa yếu tố bệnh B và lượng cholesterol
c. Tương quan giữa 2 biến định lượng
Ví dụ 23: Ta muốn khảo sát có sự tương quan giữa thời gian leo cây và hàm lượng
thuốc được tiêm trên chuột hay không? Kết quả quan sát về thời gian leo cây y
(phút) của chuột đă được tiêm hàm lượng x (mg) thuốc tăng lực A trong bảng 14.
Bảng 14. Thời gian leo cây của chuột và hàm lượng thuốc A
x 30 18 41 38 29 39 46 41 42 24 20
y 186 183 171 177 191 177 175 176 171 196 197
Với dữ liệu này, ta tính được các tham số mẫu:
=
=
=
=
=
n
x
s
y
s
11;
33, 454;
9, 678;
181,818;
9, 463
x
y
n
−
−
(
y
)
x i
x y )( i
∑
i
= 1
=
R
n
n
2
2
−
−
(
)
(
)
x
y
x i
y i
∑
∑
i
i
= 1
= 1
n
−
−
(
)
y
x i
)( x y i
∑
= 1
i
=
Hệ số tương quan thực nghiệm
−
(
1)
n
s s x
y
= -0,834.
Hệ số tương quan này còn được gọi là hệ số tương quan Pearson.(Anthony
Hayter, 2007)
= 0,7 nghĩa là 70% độ phân tán của y được giải thích bởi
Hệ số xác định R2
hồi quy tuyến tính của y theo x, còn 30 % độ phân tán của y chưa giải thích được.
30 % này có thể do sai số ngẫu nhiên của thí nghiệm hoặc mức độ tương thích của
DL với mô hình hồi quy chưa cao. (Đào Hữu Hồ và tgk, 2004)
Mô hình hồi quy tuyến tính giữa x (biến độc lập) và y (biến phụ thuộc) là:
=
+ +
y
y = ax + b
là giá trị dự
axi
b e i
RS
y
=
= −
a
y ax
Mô hình hồi quy tuyến tính tổng quát là: trong đó y
s
x
=
y
− là phần dư (residuals).
= - 0,816 là hệ số góc hoặc độ dốc, b = 209,107 là điểm cắt báo,
e i
y i
trên trục tung khi x = 0,
Từ đó, ta có phương trình hồi quy là y = - 0,816x + 209,107
Dùng phép kiểm t để KĐ sự tương quan giữa x và y như sau:
R
=
−
t
n
2
Đặt giả thuyết Ho: X và Y không tương quan
2
−
1
R
~ Student(n-2)
Tính được t = -4,534
A(9) = 3,249
A0,01A
A E Lấy α = 0,01 thì giá trị tới hạn C = tE
Vì |t| > C nên bác bỏ Ho.
Kết luận: x và y có tương quan và do R < 0 nên đây là sự tương quan nghịch.
Cách tính hệ số tương quan Pearson chỉ được sử dụng khi x và y tuân theo luật
PPC. Nếu x và y không tuân theo luật PPC thì phải sử dụng hệ số tương quan
Spearman hoặc Kendall (Nguyễn Văn Tuấn, 2007)
Trong mô hình phân tích hồi quy và tương quan nói trên, nhà nghiên cứu cần
tìm mô hình và mối liên hệ giữa một biến phụ thuộc liên tục và một hay nhiều biến
độc lập. Nếu biến phụ thuộc không phải là biến liên tục mà là biến nhị phân: có
bệnh/không bệnh, tử vong/ không tử vong, …thì cần phải sử dụng phương pháp
phân tích hồi quy logistic. (Jay L. Devore, 2004)
Điều kiện của phân tích tương quan định lượng là:
A là các biến cố định, không có sai sót ngẫu nhiên trong đo lường. iE
- Các giá trị xA
- Phần dư tuân theo luật PPC.
- Phần dư có trung bình bằng 0 và phương sai không đổi cho mọi đối tượng
- Không có tương quan giữa các phần dư.
Để kiểm tra các điều kiện này, ta cần phải tính các tham số liên quan đến phần dư:
* Giá trị dự báo, phần dư và độ lệch chuẩn của phần dư (xem bảng 15)
Bảng 15. Phần dư của mô hình hồi quy tuyến tính
y Observation x Predicted y Residuals Standard Residuals
30 186 18 183 41 171 38 177 29 191 39 177 46 175 41 176 42 171 24 196 20 197 1 2 3 4 5 6 7 8 9 10 11 184.636 194.424 175.663 178.110 185.452 177.295 171.585 175.663 174.848 189.530 192.793 1.364 -11.424 -4.663 -1.110 5.548 -0.295 3.415 0.337 -3.848 6.470 4.207 0.261 -2.189 -0.894 -0.213 1.063 -0.056 0.654 0.065 -0.737 1.240 0.806
* Các tham số TK khác của phần dư (xem bảng 16)
Bảng 16. Các thông số TK của phần dư
Residuals StatisticsP
a
Minimum Maximum Mean
Std. Deviation
N
Predicted Value
20.50
42.68
33.45
8.074
11
Residual
-14.446
6.729
.000
5.337
11
-1.604
1.143
.000
1.000
11
Std. Predicted Value
Std. Residual
-2.568
1.196
.000
.949
11
A là các biến cố định, không có sai sót ngẫu nhiên trong đo lường. Điều iE
* KĐ các điều kiện của mô hình hồi quy - Các giá trị xA
kiện này thông thường đã thỏa mãn nếu các phương pháp đo lường được thực hiện
đúng chuẩn.
P và
- Phần dư tuân theo luật PPC: Sử dụng phép kiểm Kolmogorov-SmirnovP
Shapiro-Wilk, kết quả cho thấy phần dư có PPC ( p > 0,05) (Xem bảng 17)
Bảng 17. Kết quả KĐ tính chuẩn của phần dư
Tests of Normality
Kolmogorov-SmirnovP Shapiro-Wilk
a Sig. *
Statistic df Statistic df Sig.
11 .507 RESIDUAL .200P 11 .939
.143 Đồ thị phần dư có hình dạng của PPC (xem hình 8)
Hình 8. Đồ thị tần số phần dư
Ngoài ra, dựa vào biểu đồ XS chuẩn Q - Q plot (xem hình 9) ta thấy các giá trị quan
sát và giá trị mong đợi tập trung gần đường thẳng chứng tỏ phần dư có PPC:
Hình 9. Đồ thị XS chuẩn của phần dư
- Phần dư có trung bình bằng 0 và phương sai không đổi cho mọi đối tượng. Điều
này có thể kiểm tra theo kết quả ở phần 2 và đồ thị phân tán sau: (xem hình 10)
Hình 10. Đồ thị phân tán của phần dư
A.
iE
Các giá trị phần dư phân tán ngẫu nhiên quanh giá trị 0 (đường nằm ngang) chứng
tỏ phương sai không đổi cho mọi đối tượng xA * KĐ tính tương thích của đường thẳng hồi quy.
A: a ≠ 0 AE
Bằng phương pháp phân tích phương sai với giả thuyết: HA A: a = 0 và HA 0E Bảng 16. Kết quả phân tích phương sai
ANOVAP
b
Model Sum of Squares df Mean Square F Sig.
a
1 Regression 651.866 1 .001P
Residual 284.861
651.866 20.595 31.651 Total 936.727 9 10
Kết quả phân tích phương sai cho thấy đường thẳng hồi quy tương thích tốt (p < 0,01) (Xem bảng 16) 7. KĐ sự phù hợp của DL với PPC
Để KĐ tính chuẩn của DL, các cách sau thường được sử dụng :
Cách 1 : Vẽ biểu đồ DL đường cong chuẩn. Nếu biểu đồ có dạng hình chuông
đối xứng với tần số cực đại nằm ở giữa, các tần số thấp hơn nằm ở hai bên, giá trị
trung bình và trung vị gần bằng nhau và độ lệch gần bằng 0.
Cách 2 : Vẽ biểu đồ XS chuẩn. Khi biểu đồ XS của DL có quan hệ tuyến tính
thì DL tuân theo PPC.
Cách 3 : Dùng KĐ Kolmogorov-Smirnov khi cỡ mẫu lớn hơn 50 hoặc KĐ
Shapiro-Wilk khi cỡ mẫu nhỏ hơn 50. DL sẽ có PPC khi p > 0,05
=
=
u
,
u
x
Trong trường hợp DL không có PPC thì dùng các phép hoán chuyển DL về chuẩn
1 x
bằng các hàm toán học như u = logx, , u = arcsinx,…
Nếu sau khi hoán chuyển, DL vẫn chưa chuẩn thì dùng các phép kiểm phi
tham số như Wilcoxon-Mann-Whitney.
97, 100, 110, 106, 103, 108, 97, 92, 113, 112, 88, 100, 95, 101, 124, 95, 111, 99, 84, 93, 82, 115,
88, 85, 79, 90, 100, 104, 109, 100, 90, 84, 102, 98, 93, 102, 102, 102, 110, 109, 90, 114, 106, 115,
103, 89, 93, 83, 100, 106, 100, 111, 101, 88, 80, 89, 103, 91, 91, 119, 97, 116, 118, 117, 95, 92,
123, 81, 102, 95, 106, 106, 94, 103, 96, 89, 94, 122, 110, 100, 80, 108, 101, 111, 98, 97, 105, 105,
98, 86, 105, 97, 87, 111, 107, 115, 96, 110, 79, 107
Ví dụ 24. Đo đường huyết x (mg%) 100 người lớn khỏe mạnh có kết quả sau:
Để biết DL này có tuân theo PPC chuẩn không, cách đơn giản nhất là vẽ biểu
đồ tần số (xem hình 11).
Hình 11. Phân phối DL đường huyết của người lớn khỏe mạnh
Nhìn trên biểu đồ tần số, DL về đường huyết của 100 người có dạng hình
chuông, tần số cao nhất tập trung ở giữa và thấp dần về hai bên. Đây là hình dạng
của PPC.
Trong trường hợp nghiên cứu trên một mẫu có kích thước lớn, để tính tham số
mẫu thuận tiện và sai số không đáng kể, có thể phân chia DL thành nhiều lớp theo
Gọi k là số lớp cần phân chia: k ≥ 1 + 3,32lgn
=
−
Gọi
xR là miền biến thiên của x:
R x
x i
max = n i 1,
x min i = n i 1,
Gọi khoảng rộng của mỗi lớp là
.
∆ ≤ x
xR k
=
δ
Như vậy sai số
. Với
x∆ đã biết, phân chia số liệu vào các lớp từ
∆ x 2
1iα− đến iα (Đặng Đức Hậu, 2010, tr.66)
quy tắc sau:
=
=
=
− 124 79
45
m
axx
124; m nx
i
79
Trong ví dụ 24 ta có:
xR =
i
i
nên
=
5, 625
∆ ≤ x
⇒ ∆ = 5 x
k ≥ 1 + 3,32lg100 = 7,64
45 8
Lấy k = 8,
=
=
x
99, 45;
s
10,173
Sắp xếp DL vào 8 lớp như trong bảng 17
Sau khi ghép lớp, các tham số TK tính được:
Dùng phép kiểm chi bình phương để KĐ tính chuẩn của DL:
A: x có phân phối chuẩn N(99,45; 10,173A 0E
2 A) E
99, 45
=
z
Đặt giả thuyết HA
A: 0E
− x 10,173
Theo HA ~ N(0; 1)
≤
=
≤
=
≤ −
P x (
85)
P z (
1, 42)
Tính các giá trị xác suất theo phân phối chuẩn tắc
− 85 99, 45 10,173
P z
=
P
(85
≤ ≤ x
90)
P
− ( 1, 42
≤ ≤ − z
0,93)
= 0,08
=
P
(90
≤ ≤ x
95)
P
− ( 0.93
≤ ≤ − z
0, 44)
= 0,1
= 0,15
=
P
(95
≤ ≤ x
100)
P
− ( 0, 44
≤ ≤ z
0, 05)
=
P
(100
≤ ≤ x
105)
P
(0, 05
≤ ≤ z
0,55)
= 0,19
=
P
(105
≤ ≤ x
110)
P
(0,55
≤ ≤ z
1, 04)
= 0,19
=
P
(110
≤ ≤ x
115)
P
(1, 04
≤ ≤ z
1,53)
= 0,14
≥
=
≥
P x (
115)
P z (
1,53)
= 0,09
= 0,06
= × và tính được như trong bảng 17.
' n i
n p i
−
(
n i
2' n ) i
∑
2
i
2 χ
=
Với n = 100, tần số lý thuyết
0,05 (5)χ
' n i
Tính chi bình phương theo công thức = 2,376 < = 11,07 nên
A (p = 0,8) 0E
chấp nhận HA
Kết luận: x có phân phối chuẩn
Bảng 17. DL đường huyết được phân thành 8 lớp
ix ≤ 85
85 - 90 - 100 - 105 - 110 - 95 - ≥ 115
100 95 105 110 115 90
in
18 13 16 15 10 7 11 10
ip 0,08
'
0,15 0,19 0,19 0,14 0,09 0,06 0,1
in
−
(
n i
2' n ) i
∑
2
i
2 χ
=
15 19 19 14 9 5 10 8
A (p = 0,8) 0E
0,05 (5)χ
' n i
- Tính được = 2,376 < = 11,07 nên chấp nhận HA
µ= ±
=
±
=
x
100, 03
± 100, 03 2, 08
- Kết luận: x có phân phối chuẩn
Cs n
1,96.10, 616 100
khoảng tin cậy 95% là:
⇒ 97,95 ≤ µ ≤ 102,11 Như vậy, nếu chọn một người có đường huyết 123 thì có thể coi đường huyết
của người này là bất thường vì nó không nằm trong khoảng tin cậy 95% này.
Trong bài toán KĐ sau, DL không có PPC vì thế không thể thực hiện phép
kiểm t. Trong trường hợp này phương pháp thường dùng là hoán chuyển DL hoặc
dùng phép kiểm phi tham số Wilcoxon.
Ví dụ 25. Men gan ALT (U/l) người bình thường (nhóm 1 gồm 16 người) và người
viêm gan B (nhóm 2 gồm 18 người)
Nhóm 1 (X1) : 36, 35, 24, 26, 23, 35, 19.5, 27, 19, 18, 42, 36.7, 40.5, 53.7, 64, 112.9
Nhóm 2: (X2) 92, 93, 23, 47, 266, 107, 82.7, 37, 157, 47, 38, 34, 19, 34, 114, 36, 57.8, 41.8
Hỏi: Hàm lượng ALT của người viêm gan B có cao hơn người bình thường
không?
Dựa vào kết quả KĐ tính chuẩn của hai nhóm bằng phép kiểm shapiro và biểu
đồ tần số (xem hình 12 và 13) cho thấy X1 và X2 không có PPC (p < 0,05):
Hình 12. Phân phối DL ALT của nhóm 1
Hình 13. Phân phối DL của ALT nhóm 2
Với kết quả KĐ trên chưa thể thực hiện phép kiểm t để so sánh hai trung bình.
Cách 1: Hoán chuyển DL bằng hàm log: Y1 = log(X1) và Y2 =log(X2)
Kết quả KĐ tính chuẩn DL sau hoán chuyển cho thấy Y1 và Y2 có PPC (p > 0,05)
So sánh hai phương sai của DL sau hoán chuyển (Y1, Y2) cho thấy hai phương sai
đồng nhất do p = 0,179 > 0,05
var.test(Y1, Y2)
F test to compare two variances
data: Y1 and Y2
F = 0.4968, num df = 15, denom df = 17, p-value = 0.1798
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval: 0.1824421 1.3973849
sample estimates:ratio of variances 0.4967957
Như vậy, hai điều kiện của phép kiểm t đã thỏa mãn là:
- DL có PPC
- Phương sai hai mẫu đồng nhất
Bây giờ có thể dùng phép kiểm t để so sánh hai trung bình.
A ≥ µA A: µA 1E 0E
A; µA 2E
A < µA 1E
2E
Đặt giả thuyết một đuôi: HA
Kết quả của phép kiểm t trong bảng 18
Bảng 18. Kết quả phép kiểm t - so sánh lượng men gan ALT
t-Test: Two-Sample Assuming Equal Variances
Y1 Y2
Mean 3.517342 4.05407
Variance 0.23903 0.48114
Observations 16 18
Pooled Variance 0.367653
df 32
t Stat -2.57627
P(T<=t) one-tail 0.007403
A. 0E
Kết quả KĐ một đuôi cho thấy p = 0,007 < 0,05 nên bác bỏ HA
Kết luận: Hàm lượng ALT của người bị viêm gan B cao hơn người bình
thường
Cách 2: Dùng phép kiểm phi tham số Wilcoxon từ DL gốc X1 và X2
wilcox.test(X1,X2)
Wilcoxon rank sum test with continuity correction
data: X1 and X2
W = 77.5, p-value = 0.02271
alternative hypothesis: true location shift is not equal to 0
A. 0E
Kết quả cho thấy p = 0,02 < 0,05 nên bác bỏ HA
Kết luận: Hàm lượng ALT của người bình thường và người bị viên gan B khác
nhau có ý nghĩa TK.
Ví dụ 26. Trong đề tài : “So sánh các thông số tầm soát trước sinh ở nhóm thai phụ
mang thai bình thường và nhóm thai phụ mang thai hội chứng Down”
Các tác giả đã so sánh hàm lượng AFP, HCG và UE3 của nhóm phụ nữ mang
thai bình thường và nhóm phụ nữ mang thai hội chứng Down
Mục tiêu: Xét tính phân phối Gaussian (PPC) của dân số tham gia sàng lọc ba
tháng giữa thai kỳ tại đơn vị sàng lọc trước sinh của bệnh viện Y. Xác định giá trị
phân biệt của các thông số TK giữa 2 nhóm thai phụ mang thai bình thường và thai
phụ mang thai hội chứng Down.
Phương pháp: Nghiên cứu hồi cứu, 01/2007 - 01/2008, dữ liệu sàng lọc trước
sinh triple test (AFP, hCG và uE3) của 6169 thai phụ có thai từ 15 đến 21 tuần tuổi và
dữ liệu của 36 thai phụ mang thai hội chứng Down được xử lý bằng phần mềm
STATA 10.0 để tìm hiểu về tính thể hiện phân phối Gaussian của các dữ liệu này và
sự khác biệt của các thông số TK giữa hai dân số thai phụ mang thai bình thường và
mang thai hội chứng Down, so sánh với một số nghiên cứu khác về sự khác biệt
này.(Đỗ Thanh Thủy và tgk, 2009)
Dữ liệu sàng lọc trước sinh của các thai phụ bị hội chứng Down:
AFP: 0.57, 0.72, 0.73, 1.01, 0.31, 0.49, 0.69, 1.23, 1.12, 0.82, 0.41, 0.94, 0.61, 1.17,
0.62, 0.48, 0.65, 0.65, 1.65, 0.82, 0.95, 0.35, 0.32, 0.48, 0.54, 0.54, 0.45, 1.29, 0.85,
0.6, 0.91, 0.6, 0.58, 0.95, 0.69, 1.25
hCG: 2.3, 3.2, 1.3, 2.8, 1.9, 2.0, 3.3, 2.3, 2.9, 3.8, 2.1, 3.0, 1.9, 4.0, 1.7, 1.5, 2.2, 0.8,
3.9, 1.7, 2.2, 2.2, 1.4, 2.1, 2.1, 3.0, 1.3, 3.2, 3.3, 2.1, 1.1, 0.9, 0.8, 6.8, 2.5, 2.8
uE3: 0.66, 0.59, 0.74, 0.52, 0.21, 0.86, 0.6, 0.44, 0.67, 0.9, 0.41, 1.08, 0.12, 0.83,
0.73, 0.94, 0.27, 0.48, 1.25, 1.11, 0.81, 0.25, 0.13, 0.48, 0.5, 0.58, 0.53, 0.95, 0.97,
0.34, 1.06, 0.29, 0.35, 0.49, 0.24, 0.62
Kết quả KĐ tính chuẩn DL
shapiro.test(AFP)
Shapiro-Wilk normality test
data: AFP
W = 0.9372, p-value = 0.04162
shapiro.test(HCG)
Shapiro-Wilk normality test
data: HCG
W = 0.8844, p-value = 0.001311
shapiro.test(UE3)
Shapiro-Wilk normality test
data: UE3
W = 0.9725, p-value = 0.499
Trong ba dãy DL này, AFP và HCG không có PPC. Các nhà nghiên cứu đã
hoán chuyển DL bằng hàm log để DL có PPC (Xem hình 13)
Hình 14. Phân phối Gaussian của log(uE3MoM) giữa nhóm thai phụ mang thai
bình thường và nhóm mang thai hội chứng Down
Theo tác giả, việc hoán chuyển DL bằng hàm log10(MOM) của các thông số
sàng lọc AFP, hCG và uE3 sang phân phối Gaussian (PPC) giúp cho việc sàng lọc
chính xác, ít bị ảnh hưởng của các giá trị ngưỡng trên, ngưỡng dưới và cỡ mẫu,
đồng thời cho phép dễ dàng so sánh giữa các nghiên cứu với nhau. Các thông số TK
giữa hai dân số thai phụ mang thai bình thường và mang thai hội chứng Down của
AFP, hCG và uE3 là khác biệt có ý nghĩa TK với p < 0,05.
Từ kết quả này, các tác giả đưa ra kết luận: Với sự khác biệt có ý nghĩa giữa
các thông số TK của hai dân số mang thai bình thường và dân số mang thai hội
chứng Down, bộ ba xét nghiệm sàng lọc ba tháng giữa thai kỳ có ý nghĩa trong việc
phát hiện các thai phụ có nguy cơ cao mang thai hội chứng Down, đặc biệt đối với
các tỉnh thành xa trung tâm ở Việt Nam.
PHỤ LỤC 2
BIÊN BẢN GIỜ HỌC "MÔ HÌNH NGƯỠNG"
Trong bản này, chữ in nghiêng là ghi chú của người quan sát, chữ được gạch
dưới là chỗ GV viết lên bảng.
1. GV : Như chúng ta đã biết trong bài học trước về việc chỉ định xét nghiệm như
thế nào để tránh gây lãng phí và tiết kiệm thời gian cho bệnh nhân nhưng vẫn đảm
bảo chẩn đoán chính xác.
2. GV hỏi : Để chẩn đoán được chính xác, các anh chị hãy cho biết quy trình của
một chẩn đoán là gì? Sau 3 phút
3. SV: Thưa thầy, khi một người đến khám bệnh thì có thể người đó bị bệnh hoặc
người đó không bị bệnh. Trường hợp không bị bệnh do khám lâm sàng thấy những
biểu hiện của bệnh hầu như không có hoặc tần suất bệnh quá thấp thì sẽ cho bệnh
nhân về nhà tự theo dõi. Trường hợp có khả năng bị bệnh căn cứ vào những triệu
chứng mà người bệnh kể hoặc tần suất bệnh cao, để giúp chẩn đoán chắc chắn hơn
ta sẽ chỉ định những xét nghiệm xem kết quả xét nghiệm dương tính hay âm tính để
ra quyết định.
4. GV : Như vậy, khi nghi ngờ một người bị bệnh, em đều cho làm xét nghiệm à?
5. SV : Dạ, vâng!
6. GV: Cả lớp có bổ sung gì về câu trả lời của bạn không? Lớp im lặng không có
câu trả lời
7. GV : Câu trả lời của bạn SV này đúng nhưng chưa đủ, để hiểu rõ hơn quy trình ra
quyết định cho một trường hợp lâm sàng, hôm nay, chúng ta học một phương pháp
khác có thể giúp ích cho chẩn đoán bệnh dựa vào tần suất bệnh và kết quả của các
UMÔ HÌNH NGƯỠNG
xét nghiệm. Đó là phương pháp mô hình ngưỡng. GV viết lên bảng
Mô hình này do hai nhà khoa học UPauker và Kassier (1980)U đưa ra, viết tắt là Umô
hình ngưỡng P – K
Vấn đề đặt ra là, khi khám lâm sàng cho một người nghi ngờ bị bệnh B, làm thế nào
để đưa ra quyết định đúng.
UĐể bệnh nhân theo dõi mà không điều trịU, cũng không cần chỉ định xét
8. GV : Trong trường hợp này, chúng ta thường gặp ba tình huống sau :
-
UCho điều trị ngay Unếu xác suất bệnh của bệnh nhân đủ để ra quyết định điều
nghiệm nào nếu xác suất bệnh của bệnh nhân quá thấp.
-
UCần chỉ định xét nghiệmU vì xác suất bệnh của bệnh nhân không đủ để ra
trị.
-
≤
P B+ (
quyết định loại trừ và cũng không đủ để ra quyết định điều trị ngay.
≤ ) 1
Theo P-K, tại một thời điểm nhất định, Uxác suất bệnh của bệnh nhân 0
(GV vẽ mô hình trên bảng)
Vùng theo dõi Vùng xét nghiệm Vùng điều trị
Tγ
tT
0
tT và Tγ chia đoạn [0;1] thành 3 vùng :
1 Trong đoạn này, có hai mốc đáng chú ý là U
tT là điểm mà tại đó không có sự khác biệt giữa việc để bệnh nhân theo dõi và việc
vùng theo dõi, vùng xét nghiệm và vùng điều trị.
chỉ định xét nghiệm, Tγ là điểm mà tại đó không có sự khác biệt giữa việc chỉ định
xét nghiệm và việc điều trị.
(
)
GV (viết trên bảng) : U1. Các xác định xác suất tiền nghiệm
P B+ của bệnh nhân trước xét nghiệm
9. GV : Vấn đề đặt ra là xác suất bệnh
(XSTN) được xác định như thế nào?
10. SV : Dựa vào tần suất bệnh và triệu chứng lâm sàng.
11. GV : Đúng rồi, bác sĩ cần dựa vào tần suất bệnh trong cộng đồng và điều chỉnh
thêm dựa vào bệnh sử và khám lâm sàng của bệnh nhân. Trước khi chỉ định một xét
nghiệm, người thầy thuốc nên nhớ một nguyên lý cơ bản của Sackett rằng các dữ
liệu thu thập được qua thăm khám lâm sàng và hỏi bệnh sử thì quan trọng hơn rất
nhiều các thông tin mà các xét nghiệm mang lại.
12. GV : (đọc và ghi trên bảng) VD: Một bệnh nhân bị Urun tayU và có Unhịp tim nhanh U
thì có nguy cơ Ucường giáp (80%)U cao hơn Unguy cơ bị Wilson (1%)U rất nhiều. Tuy
nhiên qua hỏi bệnh sử thì bệnh nhân cho biết bệnh nhân Ucó em trai đã được chẩn
đoán bị bệnh WilsonU, Ukhi đó khả năng bị bệnh Wilson của bệnh nhân tăng lên 95%.
13. SV : Thưa thầy, các con số này chỉ mang tính định tính?
14. GV : Đúng như vậy, vì xác suất này chỉ dựa trên tần suất bệnh. Để mang tính
định lượng, người thầy thuốc nên cho XSTN của bệnh nhân dưới dạng % thay vì
dùng các từ “nghi ngờ”, “có thể” hay “nhiều khả năng”.
15. GV tiếp tục với câu hỏi: Khi có XSTN rồi, chúng ta sử dụng mô hình ngưỡng
như thế nào?
16. SV : Chúng ta xem xác suất đó nằm trong vùng nào của mô hình ngưỡng để ra
quyết định.
)
(
GV (viết trên bảng):U2. Quyết định lâm sàng
P B+ , hoặc xác suất hậu nghiệm
+
−
+ P B T
(
/
),
+ P B T
(
/
)
U, gọi chung là p) rồi, chúng ta sử dụng mô hình ngưỡng để đưa
17. Khi có xác suất bệnh (UXác suất tiền nghiệm
Uxác định xem p nằm ở vùng nào trong 3 vùng của mô hình ngưỡng
ra quyết định. Cụ thể như sau:
UNếu
p T< thì quyết định không cho điều trị
-
t
-
UNếu p Tγ>
< <
UNếu
thì ra quyết định điều trị ngay -
p Tγ
tT
thì chỉ định một xét nghiệm -
18. GV : VD. Trong Ubệnh suyễnU, ta chọn Ungưỡng xét nghiệm là 10%U, Ungưỡng điều
trị là 80%U theo mô hình ngưỡng như sau:
Vùng theo dõi Vùng xét nghiệm Vùng điều trị
0 0,1 0,8 1
P B+ <
) 10%
(
19. GV : Nếu một bệnh nhân có khả năng bị bệnh suyễn qua hỏi bệnh sử và khám
P B+ >
) 80%
(
lâm sàng nếu thì chúng ta quyết định chỉ để theo dõi thêm và không
thì chúng ta quyết định điều trị cho bệnh nhân làm hô hấp ký. Nếu
<
<
10%
P B+ (
) 80%
ngay cho bệnh nhân mà không cần làm hô hấp ký để chẩn đoán. Nếu
, chúng ta hy vọng kết quả hô hấp ký sẽ giúp chẩn đoán hay loại
0,1
Tγ =
0,8
trừ được bệnh suyễn và cho bệnh nhân làm xét nghiệm đó.
tT =
19. SV : Tại sao có hai ngưỡng và ? Làm thế nào để xác định 2
ngưỡng này?
20. GV : Đó là vấn đề chúng ta cần nghiên cứu trong phần tiếp theo.
GV (ghi trên bảng) 3. UCách xác định ngưỡng
UCách 1
21. Chúng ta có hai cách để xác định các ngưỡng này như sau:
22. GV. Hai ngưỡng này được xác định tùy theo nhận định của các bác sĩ lâm sàng.
- Đối với những xét nghiệm đơn giản, ít tốn kém, không xâm lấn thì bác sĩ
thường chỉ định xét nghiệm đó cho dù xác suất bệnh thấp, khi đó vùng xét
nghiệm rộng ra.
- Trái lại, bác sĩ ít muốn chỉ định xét nghiệm nếu xét nghiệm tốn kém, xâm
lấn, ít chính xác. Khi đó, vùng xét nghiệm hẹp lại.
23. SV : Nhưng nếu chỉ dựa vào những nhận định như vậy, em nghĩ sẽ kém chính
tT và Tγ khi đó chỉ mang tính định tính.
xác vì các ngưỡng
24. GV : Đúng vậy, hai ngưỡng này được xác định dựa vào tính chất của bệnh và
UCách 2
bản chất của xét nghiệm.
tT và Tγ như
25. GV: Để khắc phục nhược điểm trong việc nhận định 2 ngưỡng
tT và Tγ dựa vào phương
các em có ý kiến ở trên, có tác giả đề nghị cách xác định
− 1
− 1
+
−
=
+
=
+
LR
LR
.
1
;
.
1
T t
T t
B R
B R
trình sau:
Trong đó, UR là tỷ lệ gây rủi ro (Risk), B là tỷ lệ lợi ích (Benefits)U.
26. GV : Sau đây chúng ta sẽ xét một ví dụ minh họa. GV viết trên bảng
UDùng xét nghiệm siêu âm có ss = 0,6 và sp = 0,7 trên một người bị MI thì có tỷ số
3
= U. UTính
tT và Tγ của xét nghiệm trên loại bệnh này.
B R
tT và Tγ
Bây giờ dùng công thức trên, các em tính 2 ngưỡng
GV để SV làm trong 5 phút, sau đó gọi một SV lên bảng tính
− 1
− 1
− 1
+
=
+
=
+
=
=
.
1
1
+ .3 1
0,142
LR
T t
ss −
B R
1
B . sp R
0, 6 − 1 0, 7
− 1
− 1
− 1
1
−
=
+
=
+
=
=
.
1
1
+ .3 1
0, 28
LR
T t
B R
− ss B . sp R
− 1 0, 4 0, 7
27. SV viết trên bảng:
Sau khi tính xong, SV về chỗ ngồi. GV quan sát trên bảng và nhận xét.
28. GV : Kết quả tính toán trên là hoàn toàn chính xác.
29. GV : Bây giờ chúng ta sẽ xem xét quy trình dùng mô hình ngưỡng cho một
P B+ (
)
UXác định xác suất tiền nghiệm
U của bệnh nhân.
trường hợp lâm sàng. Chúng ta thực hiện theo trình tự sau: (GV viết trên bảng)
( P B
UNếu xác suất
+ ≤ U U thì không điều trị )
Sau đó, xem xác suất này nằm ở vùng nào trong ba vùng của mô hình ngưỡng.
T t
P B (
+ ≥ )
UNếu
U Uthì cho điều trị
•
Tγ
+
≤
≤
Tγ
P B (
)
UNếu
U Uthì chỉ định xét nghiệmU với hy vọng xác suất hậu
•
tT
•
tT và Tγ . Nếu xét nghiệm nào không
nghiệm sẽ vuợt ra khỏi hai ngưỡng
đưa xác suất hậu nghiệm ra khỏi hai ngưỡng này thì xét nghiệm đó không
có giá trị và chúng ta không nên chỉ định những xét nghiệm như vậy.
GV ngừng lại một lúc khoảng 1 phút
30. GV : Làm thế nào để xác định xác suất hậu nghiệm sau khi có kết quả xét
nghiệm?
31. SV: Dùng công thức Bayes.
32. GV : Đúng rồi, ta có thể dùng công thức Bayes hoặc các phương pháp mà các
em đã được học như : phương pháp tỷ cơ hội, phương pháp bảng 2 x 2…
GV(viết trên bảng) 4. UCách tính xác suất hậu nghiệm
33. GV : Như vậy trong trường hợp phải chỉ định một xét nghiệm, sau khi có kết
quả xét nghiệm, xác suất bệnh của bệnh nhân sẽ thay đổi. Xác suất này ta gọi là xác
suất hậu nghiệm (XSHN).
34. GV : Chúng ta chú ý, đây là những xác suất có điều kiện, và như vậy ta có thể
sử dụng các công thức tính xác suất có điều kiện trong phần trước để tính xác suất
+
+
−
+
+
−
(
/
B
)
(
/
B
)
=
=
+ P B T
(
/
)
+ P B T
(
/
)
này. Một trong những công thức đó là công thức Bayes.
+ P B P T ). ( + P T (
)
+ P B P T ). ( − P T (
)
;
35. GV. Chúng ta sẽ làm một phép kiểm minh họa cho mô hình này.
GV đọc và chép phép kiểm trên bảng:
Một mẫu gồm U35 ngườiU lấy ngẫu nhiên từ dân số D để khảo sát tình hình bệnh B,
- + U) và 15 người không bị bệnh B (BU bác sĩ thấy Ucó 20 người bị bệnh B (BU
P). UĐo lượng
P P P
X (mg/l) Utrong mẫu trên ta có kết quả sau:
+ U : 9 10 10 12 13 13 13 14 14 14 15 15 16 16 17 17 17 17 18 19 BP
P
- BP
U : 16 16 17 17 18 18 18 18 18 18 19 19 19 19 19
P
1T để chẩn đoán bệnh B. Lấy
X Cf≤ 1
X Cf> 1
Ta muốn dùng số đo lượng X như là một xét nghiệm
U; U 1T − khi
0, 25
điểm cắt UCf UR1RU = 17U với quy định U 1T + khi
tT =
0, 7
Trong mô hình ngưỡng P – K, chọn ngưỡng xét nghiệm là và ngưỡng điều
Tγ =
trị là . Bác sĩ chẩn đoán anh M trong D có bệnh B, cho M làm xét nghiệm
1T − thì không điều trị, nếu là
1T + thì điều trị. Bác sĩ
TR1 , Rkết quả xét nghiệm nếu là
quyết định như vậy đúng không? Tại sao?
36. GV : Chúng ta thực hiện theo các bước của mô hình ngưỡng. Nào, trước hết các
em hãy suy nghĩ và tính độ nhạy và độ chuyên của xét nghiệm. Sau 2 phút, GV gọi
một SV lên bảng.
- + BP
37. SV viết trên bảng
BP Tổng
1T +
18 4 22
1T −
2 11 13
+
−
)
)
=
=
=
=
=
=
ss
sp
0,9;
0, 73
+ P T B ( 1 + P B ( )
18 20
− P T B ( 1 − P B ( )
11 15
Tổng 20 15 35
Sau 5 phút, SV làm xong về chỗ ngồi.
38. GV. Chúng ta xem bạn tính đúng chưa? GV quan sát trên bảng một lúc.
39. GV. Hoàn toàn chính xác.
40.GV: Bước tiếp theo chúng ta tính xác suất tiền nghiệm để xem xác suất này nằm
trong vùng nào của mô hình ngưỡng. Xác suất tiền nghiệm trong trường hợp này
được xác định như thế nào?
Cả lớp im lặng một lúc rồi một SV trả lời :
41. SV : Dựa vào số liệu khảo sát.
GV yêu cầu sinh viên này tính xác suất tiền nghiệm trong vở ghi của mình và đứng
=
P B+ =
(
)
0,57
20 35
cạnh quan sát sau đó đi về bảng và viết:
42. GV : Các em có nhận xét gì về xác suất này? Trong trường hợp này bác sĩ cho
làm xét nghiệm có đúng không?
UMô hình ngưỡng P – K
Các em thử vẽ mô hình ngưỡng ra xem nào. GV vẽ trên bảng
0, 7
0, 25
Không điều trị Cho làm xét nghiệm Điều trị
Tγ =
tT =
0
P B+ =
) 0,57
(
GV để một lúc khoảng 3 phút để sinh viên suy nghĩ tìm câu trả lời.
43. Một SV : Do nằm trong vùng xét nghiệm nên bác sĩ cho M làm xét
nghiệm là đúng.
44. GV : Bây giờ bác sĩ đã chỉ định xét nghiệm, công việc tiếp theo của chúng ta là
tính xác suất hậu nghiệm để xem xác suất này nằm ở vùng nào trong mô hình
1T + và
1T − . Các em suy nghĩ và tính toán, sau
ngưỡng với hai khả năng xét nghiệm
đó tôi sẽ gọi một bạn lên bảng tính các xác suất này. GV để SV tính trong thời gian
5 phút sau đó gọi một SV lên bảng.
45. SV viết trên bảng:
+
−
=
+
−
=
+ −
=
)
). (
(
/
B
)
). (
(
/
B
) 0,57.(1 0,9)
(1 0,57).0, 73 0,371
− P T ( 1
− + P B P T 1
− − P B P T 1
+
B
(
/
)
=
<
=
=
=
0,154
0, 25
(
/
)
Nếu 1T − , ta có:
T t
− + P B T 1
0,57.0,1 0,371
− + P B P T ). ( 1 − P T ( ) 1
nên bác sĩ không điều trị
+
(
/
B
)
+
=
=
=
>
=
/
,
)
0,816
0, 7
cho M là đúng.
T γ
+ + T P B T ( 1 1
0,57.0,9 − 1 0,371
+ + ). ( P B P T 1 + P T ( ) 1
Nếu nên bác sĩ điều trị
cho M là đúng. SV làm xong về chỗ ngồi
46. GV : Các em có nhận xét gì về bài làm trên bảng? (GV quan sát bảng). Như vậy
các quyết định của bác sĩ trong trường hợp này là đúng vì kết quả đó phù hợp với
mô hình ngưỡng P – K. Các em đã hiểu rõ về mô hình ngưỡng và ứng dụng mô hình
này vào chẩn đoán chưa?
47. GV : Trong chăm sóc và điều trị bệnh, người thầy thuốc luôn phải đối mặt với
hai vấn đề quan trọng : Chẩn đoán đúng và lựa chọn điều trị sao cho có lợi nhất cho
bệnh nhân. Giải quyết hai vấn đề này không dễ dàng, nhất là trong những tình
huống lâm sàng phức tạp.Có nhiều trường hợp phải sau một thời gian điều trị, bác sĩ
mới có được chẩn đoán bệnh. Khi có chẩn đoán bệnh rồi thì việc lựa chọn phương
án điều trị nào trong nhiều phương án cũng gặp nhiều khó khăn, đôi khi chỉ dựa vào
kinh nghiệm nên thiếu cơ sở khoa học. Để giải quyết những tình huống lâm sàng
phức tạp thì việc sử dụng mô hình ngưỡng để phân tích các quyết định lâm sàng là
một công cụ khoa học quan trọng, giúp người thầy thuốc đưa ra các quyết định đúng
đắn.
48. GV : Các em về nhà đọc kỹ lý thuyết và làm các phép kiểm ở nhà, phần phép
kiểm phần này tương đối đơn giản nhưng không được in trong giáo trình nên tôi đã
chuyển phép kiểm làm thêm cho lớp trưởng để photo cho cả lớp. Buổi học hôm nay
kết thúc ở đây.
GV cho phép kiểm làm ở nhà:
Cho biết :
Tpulmonary embolism) 2
Ttrong dân số D là
- Tỷ lệ tử vong của bệnh nghẽn mạch phổi (2
20%.
Tventilation/perfusion scan -
- Tỷ cơ hội dương và âm của xạ đồ thông khí/máu (2
TV/Q) tương ứng là 16,8 và 0,17.
0,95%
2
tT =
49%
- Trong mô hình ngưỡng P – K, chọn ngưỡng xét nghiệm và ngưỡng
Tγ =
điều trị là .
1. Bác sĩ chẩn đoán anh M trong D có bệnh nghẽn mạch phổi (gọi tắt là bệnh B),
+ P thì
cho M làm xạ đồ V/Q (gọi là tắt là xét nghiệm T). Kết quả xét nghiệm nếu TP
cho điều trị ngay. Bác sĩ quyết định như vậy có đúng không? Tại sao?
2. Tìm độ nhạy (ss), độ chuyên (sp), dương giả (Fp) và âm giả (Fn) của xét nghiệm
T.
Tγ =
0,85
3. Trong mô hình ngưỡng P – K, chọn ngưỡng xét nghiệm là TRtR = 0,15 và ngưỡng
điều trị là . Bác sĩ chẩn đoán anh M trong D có bệnh B, cho M làm xét
nghiệm nước tiểu (T). Nếu T dương tính thì cho điều trị, nếu T âm tính thì không
điều trị. Bác sĩ quyết định như vậy đúng không? Trong trường hợp này, xét nghiệm
T có giá trị trong chẩn đoán không?
PHỤ LỤC 3
BIÊN BẢN GIỜ HỌC KĐ GIẢ THUYẾT TK
Thời gian: từ 7g30 đến 9g00 ngày 10/11/2012
Giảng viên: T.Đ.T
Trong biên bản này: Chữ in nghiêng là ghi chú của người quan sát, bài giảng
được chiếu slide, chỗ nào cần nhấn mạnh thì GV ghi lên bảng.
GV mở đầu bằng việc ôn lại mục đích, ý nghĩa của KĐ giả thuyết TK, cách đặt giả
thuyết TK, các loại sai lầm trong KĐ giả thuyết TK.
1. GV: KĐ giả thuyết TK có hai bài toán cơ bản là so sánh các giá trị trung bình và
so sánh các tỷ lệ. Chúng ta đã học so sánh các tỷ lệ bằng phép kiểm phép kiểm u và
phép kiểm chi bình phương. Mỗi phép kiểm đều có điều kiện áp dụng nghiêm ngặt,
nếu không kiểm tra những điều kiện này thì kết luận rút ra từ các phép kiểm có thể
không đáng tin cậy, thậm chí sai lầm. Chẳng hạn trong phép kiểm u để so sánh hai
tỷ lệ thì điều kiện cần kiểm tra là: np ≥ 5; n(1-p) ≥ 5; 0,1< p < 0,9. Còn trong phép
kiểm chi bình phương thì điều kiện đó là tần số lý thuyết không nhỏ hơn 5.
Hôm nay chúng ta học tiếp bài toán so sánh hai trung bình bằng phép kiểm u và t.
So sánh hai trung bình là bài toán tương đối phổ biến trong TK y học, nó dùng để so
sánh các giá trị trung bình của các biến định lượng.
GV ôn lại các bước trong bài toán KĐ giả thuyết TK bằng cách đặt câu hỏi
2. GV: Chúng ta đã biết quy trình thực hiện một bài toán KĐ giả thuyết TK sau khi
đã thu thập được DL từ dân số, các bước đó là gì?
GV ngừng lại một lát để SV nhớ lại các bước trong KĐ giả thuyết TK và gọi một SV
trả lời câu hỏi
0H (giả thuyết không) và giả thuyết
AH (giả thuyết
3. SV: Bước 1 là đặt giả thuyết
thay thế). Bước 2 là sử dụng một phép kiểm để KĐ giả thuyết đặt ra. Bước 3 là dựa
0H .
vào quy tắc quyết định để kết luận chấp nhận hay bác bỏ giả thuyết
4. GV: Có em nào bổ sung thêm gì không? Trong các bước đó thì bước nào là quan
trọng nhất ?
5. SV: Bước 1 là quan trọng nhất vì nếu đặt giả thuyết sai thì sẽ dẫn đến kết luận
sai.
6. GV: Làm sao mình biết giả thuyết mình đặt là đúng hay sai?
SV này thể hiện sự lúng túng trong giây lát và sau đó phát biểu tiếp
7. SV: Mình phải đặt giả thuyết với mục đích bác bỏ, giả thuyết này phải đặt ngược
với mục đích nghiên cứu, giả thuyết này gọi là giả thuyết không, tức là không có sự
khác biệt.
GV đề nghị SV nói rõ hơn, SV nêu ra một VD.
8. SV: Ví dụ ở bài học trước, để so sánh hiệu quả của hai phương pháp điều trị bệnh
A ta so sánh tỷ lệ khỏi bệnh của hai phương pháp này bằng phép kiểm u. DL thu
thập được cho thấy tỷ lệ khỏi bệnh của hai phương pháp là khác nhau, muốn chứng
0H đối lập với DL thực tế: Tỷ lệ khỏi bệnh của hai
tỏ điều này mình đặt giả thuyết
:H p 0 1
p= 2
:AH p 1
p≠ 2
0H thì kết luận hiệu quả của hai phương pháp như nhau và nếu bác bỏ
0H thì kết
phương pháp không khác nhau, tức là và . Nếu chấp nhận
luận ngược lại.
GV khẳng định lại các phát biểu của SV và giới thiệu bài toán so sánh hai trung
bình.
9. GV: Trong nội dung KĐ giả thuyết TK về trung bình, có ba bài toán so sánh hai
trung bình:
Bài toán 1 là so sánh hai trung bình thực nghiệm độc lập, bài toán 2: So sánh hai
trung bình khi số liệu ghép cặp và bài toán 3 là so sánh trung bình thực nghiệm và
trung bình lý thuyết. Chúng ta sẽ lần lượt nghiên cứu các phương pháp để giải các
bài toán này. Trong buổi học hôm nay, chúng ta sẽ tập trung nghiên cứu lý thuyết và
thực hành giải bài toán 1: So sánh hai trung bình thực nghiệm độc lập.
Để so sánh hai trung bình ta sử dụng 2 phép kiểm là u và t. Vấn đề đặt ra là làm thế
nào để so sánh trung bình của hai dân số?
Ngừng lại một lát, GV tiếp tục:
10. Đương nhiên là chúng ta không thể khảo sát toàn bộ hai dân số đó để tính ra số
trung bình của đặc tính cần nghiên cứu. Các em đã học phương pháp của TK rồi, đó
là: Xác định cỡ mẫu, tiến hành lấy mẫu và sử dụng phương pháp KĐ giả thuyết TK
để so sánh hai trung bình. Cụ thể là ta phải lấy hai mẫu độc lập từ hai dân số đó và
so sánh hai trung bình thực nghiệm này để kết luận cho hai trung bình dân số. Để
thực hiện điều này ta chia bài toán thành 2 trường hợp: đã biết σ và chưa biết σ.
GV giải thích thêm về các trường hợp đã biết σ và chưa biết σ.
11. GV: Tương tự trong bài toán ước lượng khoảng tin cậy, σ đã biết khi đã có
nghiên cứu về đặc tính X mà chúng ta đang quan tâm hoặc trong y văn đã công bố
rồi. Chẳng hạn, quyển sách Các giá trị sinh học người Việt Nam bình thường thập
kỷ 90 - Thế kỷ XX cho biết chiều cao trung bình của nam thanh niên Việt Nam trên
18 tuổi là 163 cm và độ lệch chuẩn là 4 cm. Trong trường hợp này, khi nghiên cứu
về chiều cao của nam thanh niên Việt Nam chúng ta có thể coi như σ = 4 đã biết.
Ngược lại, những nghiên cứu mới thì chưa biết σ.
GV chiếu slide bài giảng
1. Nếu đã biết
2 2 ,σ σ 1 2
Để sánh hai số trung bình
,µ µ của hai dân số A và B có phân phối chuẩn, phương
1
2
2
sai lần lượt là
,σ σ . Lấy mẫu từ hai dân số đó, gọi
,x x lần lượt là số trung bình 1
2 1
2 2
của 2 mẫu đó.
và
Bước 1: Đặt giả thuyết
:AH µ µ≠
1
2
:H µ µ= 1 2
0
−
x 1
=
Bước 2: Theo H
0, ta có
u
~
N
(0,1)
x 2 2 2 σ σ + 1 2 n n 2 1
Bước 3: Quy tắc quyết định
- Nếu |u| ≤ 1,96 (hoặc 2,58) thì ta chấp nhận
0H
- Nếu |u| > 1,96 (hoặc 2,58) thì ta bác bỏ
0H , chấp nhận
AH , α = 0,05 (hoặc 0,01)
2. Nếu đã chưa biết
1 < 30, n
2 < 30
2 ,σ σ và n 2
2 1
Ta muốn sánh hai số trung bình
,µ µ của hai dân số A và B có phân phối chuẩn,
1
2
phương sai lần lượt là
,σ σ chưa biết. Muốn so sánh được thì ta phải giả sử
2 1
2 2
2 σ σ= 2
2 1
2
Lấy mẫu từ hai dân số đó, gọi
,x x lần lượt là số trung bình của 2 mẫu đó. 1
−
+
−
(
(
1)
n 1
2 s 2
=
Ước lượng
= =
σ σ σ 2
1
2 s 1 +
n 2 − 2
1) n 1
n 2
−
x 2
=
+
−
Theo
t
~
(
2)
0H , ta có
Student n 1
n 2
σ
+
x 1 1 n 1
1 n 2
+
−
- Nếu |t| ≤
thì ta chấp nhận
2)
t n ( α 1
n 2
0H
+
−
- Nếu |u| >
thì ta bác bỏ
2)
t n ( α 1
n 2
0H , chấp nhận
AH , α = 0,05 (hoặc 0,01)
30
30
n ≥ 1
n ≥ 2
2
2
30
30
và thì ta coi như đã biết phương sai 12. GV giải thích thêm: Nếu
n < 1
n < 2
1sσ =
2 1
2sσ =
2 2
và . Nếu và thì muốn so sánh được ta phải giả thiết
2 σ σ= 2
2 1
−
(
2)
(tức là có cùng độ phân tán), thay vào công thức của u và gọi biến mới là t
n 1
n+ 2
thì theo lý thuyết TK t ~ student .
Thí dụ 1: (Bài 13, tr.78, sách BT). Quan sát trọng lượng của 32 trẻ sơ sinh trai ta có:
X (kg)
2,2
2,5
2,8
3,2
3,4
3,7
Số trẻ
1
1
6
13
8
3
Quan sát trọng lượng trung bình của 30 trẻ sơ sinh gái ta có trọng lượng trung bình 3
kg; s = 0,3. Hỏi có sự khác nhau về trọng lượng trung bình của trẻ sơ sinh trai và gái
không?
Đặt giả thuyết:
và
:H µ µ= 1 2
0
:AH µ µ≠
1
2
2
2
nên
30
n ≥
30
GV trình bày 2 thí dụ trên slide
Vì 1
n ≥ 2
1sσ =
2 1
2sσ =
2 2
−
x 1
=
=
ta tính được
u
1,588
x 2 2 2 σ σ + 1 2 n n 2 1
Vì |u| < 1,96 nên ta chấp nhận
0H
Kết luận: Trọng lượng trung bình của trẻ sơ sinh trai và gái khác nhau không có ý
nghĩa.
và và
Thí dụ 2 : (Bài 15, tr.79- Sách BT) Hàm lượng Na+ trong máu của người có huyết áp
bình thường và người có huyết áp cao, số liệu thực nghiệm như sau :
Nhóm
Cỡ mẫu
Trung bình Độ lệch chuẩn
Huyết áp bình thường
15
144
6,2
Huyết áp cao
12
160
3,9
Kết luận ?
Đặt giả thuyết
và
:AH µ µ≠
:H µ µ= 1 2
0
1
2
−
−
+
(
1)
(
n 1
2 s 2
=
Ước lượng
= =
σ σ σ 2
1
2 s 1 +
n 2 − 2
1) n 1
n 2
−
x 2
=
= -7,77
t
σ
+
x 1 1 n 1
1 n 2
= 2,787 nên ta bác bỏ
t Vì |t| > 0,01(25)
0H , chấp nhận
AH
Kết luận: Hàm lượng Na+ trong máu của người có huyết áp bình thường và người có
huyết áp cao khác nhau có ý nghĩa.
= 5,31
GV để trống các kết qủa tính toán và yêu cầu SV tính các thông số cần thiết (bằng
máy tính bỏ túi) và thay số vào công thức để tính giá trị u và t.
Sau khi trình bày 2 thí dụ, GV đặt câu hỏi: Sự khác biệt trong hai thí dụ này là gì?
Sau một thời gian suy nghĩ (khoảng 3 phút), GV đề nghị 1 SV trả lời
13. SV: Sự khác biệt là trong thí dụ 1 thì cỡ mẫu lớn còn trong thí dụ 2 thì cỡ mẫu
nhỏ.
14. GV: Mặc dù cùng yêu cầu so sánh hai trung bình thực nghiệm độc lập nhưng cả
hai mẫu trong thí dụ 1 đều có cỡ n ≥ 30 nên ta sử dụng phép kiểm u, còn trong thí
dụ 2 cả hai mẫu đều có cỡ n < 30 nên ta sử dụng phép kiểm t như phần lý thuyết đã
trình bày.
?
15. SV: Khi sử dụng phép kiểm t, tại sao trong lý thuyết có yêu cầu muốn so sánh
2 σ σ= 2
2 1
được hai trung bình thì phải giả sử
16. GV: Đó là điều kiện của phép kiểm t, nó cũng giống như điều kiện của phép
kiểm u và Chi bình phương mà các em đã học trong bài trước đó.
,σ σ là phương sai của dân số, làm thế nào để kiểm tra được điều kiện đó?
2 1
2 2
17. SV:
18. GV: Đúng là như thế, không kiểm tra được trong bài học này vì chúng ta chưa
có công cụ nhưng trong bài học sau về phép kiểm F, chúng ta sẽ học phương pháp
so sánh hai phương sai bằng phép kiểm F.
2 σ σ= 2
2 1
19. SV: Vậy ta cứ coi như điều kiện đã được thỏa mãn?
20. GV: Đúng vậy, bài học sau sẽ có phương pháp để giải quyết vấn đề này.
21. SV: Câu hỏi của cả hai thí dụ vừa rồi là so sánh sự khác biệt của hai giá trị trung
bình, nếu có sự khác biệt thì ta cần biết trung bình nhóm nào lớn hơn. Chẳng hạn,
trong thí dụ 2 câu hỏi là: “Hàm lượng Na+ trong máu người có huyết áp cao có cao
hơn so với người có huyết áp bình thường không?” thì làm sao?
22. GV: Đây là một câu hỏi thú vị, chúng ta vẫn làm như bình thường và dẫn đến
0H , tức là sự khác biệt về hàm lượng Na+ trung bình
kết luận bác bỏ giả thuyết
trong máu người có huyết áp cao và người có huyết áp bình thường có ý nghĩa. Mặt
khác ta thấy trong thực nghiệm, trung bình về hàm lượng Na+ trong máu người có
huyết áp cao lớn hơn người có huyết áp bình thường. Từ đó có thể trả lời được câu
hỏi của bạn.
GV thể chế hóa các bước thực hiện bài toán so sánh hai trung bình thực nghiệm
độc lập thông qua hai thí dụ ở bài học này.
23. Trong bài học hôm nay các em đã biết giải quyết bài toán so sánh hai trung bình
thực nghiệm độc lập. Các bước thực hiện của bài toán này cũng giống như thực hiện
bài toán so sánh hai tỷ lệ. Điều khác biệt chỉ là điều kiện áp dụng của các phép kiểm
u và t, chúng ta cần chú ý để sử dụng phép kiểm phù hợp với yêu cầu của mỗi bài
toán.
GV cũng đưa ra đánh giá về kỹ thuật đã triển khai trong bài học
24. Mặc dù chưa bao quát hết các yêu cầu của mỗi bài toán nhưng kỹ thuật KĐ giả
thuyết TK mà chúng ta đã được học trong bài học này cơ bản đã giải quyết các tình
huống mà sau này chúng ta phải đối mặt. Nếu có thời gian các em nên tham khảo
thêm các tài liệu được liệt kê ở phần cuối của giáo trình để tìm hiểu thêm về KĐ giả
thuyết TK.
Cuối cùng, GV cho các phép kiểm để SV luyện tập ở nhà.
PHỤ LỤC 4. MỘT SỐ BÀI LÀM CỦA SV TRONG CÁC THỰC NGHIỆM
1. THỰC NGHIỆM CHƯƠNG 5 TRÊN ĐỐI TƯỢNG SINH VIÊN BÀI TOÁN 1
BÀI TOÁN 2
2. THỰC NGHIỆM CHƯƠNG 6 TRÊN ĐỐI TƯỢNG SINH VIÊN BÀI TOÁN 1
2. BÀI TOÁN 2
PHỤ LỤC 5
BIÊN BẢN CÁC TIẾT HỌC
THEO ĐỒ ÁN DẠY HỌC ĐÃ THIẾT KẾ
Lớp học được quan sát là một lớp học của SV năm thứ nhất, giờ học được quan
sát vào ngày 20/04/2012, từ 9h40’ đến 11h40’. Đây là biên bản quan sát hoạt động
của nhóm ở máy 42, 43. Phần in nghiêng là ghi chú của người quan sát.
1. GV bắt đầu bằng việc giới thiệu chương trình buổi học.
2. GV cho học sinh xem đoạn phim đã chuẩn bị sẵn, cả lớp tập trung theo dõi.
9h40’ học sinh bắt đầu xem phim, 9h55’ kết thúc phim
3. GV: Vừa rồi là một đoạn phim bài giảng về bệnh đái tháo đường. Bây giờ chúng
ta có một chút thời gian để thảo luận và tổng kết thông tin mà bác sĩ vừa trình
bày. Chúng ta xem những thông tin nào cần thiết, viết những câu kết luận thôi.
Ở trong này bác sĩ nói rất là nhiều đến nồng độ HbA1c đúng không? Các bạn
thảo luận với nhau để chúng ta tổng kết lại đoạn phim về nồng độ HbA1c của
nhóm người bị đái tháo đường và nhóm người không bị đái tháo đường. Thời
gian thảo luận bắt đầu.
− SV1: Dưới 6,5 thì bình thường
− SV2: Lớn hơn 6,5 thì…nếu điều trị thì giảm.
− SV1: Lượng HbA1c trong máu, bình thường thì không thay đổi. Nếu lượng
đường trong máu tăng thì nó sẽ làm tăng lượng HbA1c.
− SV2: Bình thường HbA1c không đổi, khi tăng thì HbA1c tỉ lệ thuận với
lượng đường huyết. Bắt đầu là cái gì đó… không nhớ…xét nghiệm bên
đường huyết đó…đường huyết…ban đầu là…bình thường thì nhỏ hơn
khoảng… Cái gì mà 110 đến một trăm hai mươi … nhớ rồi, từ 110-126 là rối
loạn.
(Còn các thông số thì sao?)
− SV1: thầy chỉ nói mình xét nồng độ HbA1c thôi mà.
− SV2: Như vậy bên lượng đường ghi là… hồi nãy nhớ là 100-110 là bình
thường, 110 – 126 bị rối loạn.
− SV1: Trên 110-126. Nếu tăng đến khoảng 90-180 thì bị rối loạn.
− SV1 ghi: Xét nghiệm đường huyết, khoảng từ 100-110: bình thường, 110-
126: rối loạn, > 126: đái tháo đường.
− SV2: Tiếp tục xét trong khoảng rối loạn.
− Nói chung nhỏ hơn 200
− SV1 ghi 168-200: rối loạn
10h3’ GV cho SV ngừng thảo luận
4. GV: Bây giờ chúng ta sẽ thống nhất lại và tôi gọi một vài nhóm cử đại diện lên
trình bày một số ý chính về đoạn phim bác sĩ vừa nói, nêu lên những kết luận
cuối cùng. GV yêu cầu một SV lên trình bày kết quả thảo luận nhóm.
5. SV: Qua những thông tin y học mà bác sĩ đưa ra thì nhóm em có những nhận
thức sau đây: bệnh tiểu đường có nhiều nguyên nhân. Có những nguyên nhân
không thay đổi được như giới tính, di truyền. Có nguyên nhân thay đổi được như
ít vận động, bị béo phì, rối loạn. Có nhiều biện pháp xét nghiệm để biết những
người nào bị bệnh tiểu đường như xét nghiệm đường huyết lúc đói hoặc xét
nghiệm nồng độ HbA1c. Kết luận ở đây là lượng HbA1c tỉ lệ với lượng đường
và ít thay đổi, cho nên xét nghiệm HbA1c thì đáng tin hơn, và nồng độ HbA1c ở
người bị bệnh đái tháo đường thì lớn hơn người bình thường.
6. GV: Như vậy, bạn đã đưa ra kết luận cuối cùng là nồng độ HbA1c của người bị
đái tháo đường thì cao hơn người không bị đái tháo đường, đúng không? Có
nhóm nào bổ sung gì không ?
Một SV giơ tay
7. GV: Nào, mời bạn
8. Một SV bổ sung: Nếu được điều trị tốt thì lượng HbA1c trở về bình thường hoặc
gần bình thường.
9. GV: Tức là đối với với những người bị đái tháo đường, nếu được điều trị đúng
thì nồng độ HbA1c sẽ trở về bình thường hoặc gần bình thường, đúng không?
Như vậy kết luận cuối cùng của chúng ta là gì? Các bạn, có nhóm nào có ý kiến
khác không?
10. GV: Không có ai có ý kiến khác nữa, phải không? Như vậy, có hai ý kiến đại
diện cho hai nhóm đưa ra ở đây, tôi xin nhắc lại. Các bạn đưa ra kết luận là nồng
độ HbA1c của những người bị đái tháo đường thì cao hơn nồng độ HbA1c của
những người không bị đái tháo đường. Và bổ sung thêm là nếu những người bị
đái tháo đường mà được điều trị đúng thì nồng độ HbA1c sẽ trở về bình thường
hoặc gần bình thường. Như vậy chúng ta sẽ ghi nhận những thông tin bác sĩ vừa
nói qua tóm tắt phần thảo luận của các bạn như phần trình bày của hai bạn vừa
rồi. Tôi sẽ phát cho các bạn một bài toán liên quan đến bệnh đái tháo đường mà
ở đây người ta đo nồng độ HbA1c của hai nhóm: một nhóm là những người bị
đái tháo đường và một nhóm là những người không bị đái tháo đường.
10h5’ kết thúc trao đổi của giáo viên và cả lớp đối với vấn đề này.
11. GV phát cho SV phiếu số 2 về nghiên cứu bệnh đái tháo đường.
12. GV: Những thông tin mà bác sĩ vừa trình bày như các bạn trong lớp đã tổng kết,
tôi tóm tắt lại trong khung hình đó. Các bạn đọc lại và đọc bài toán ở đây. Tức là
ở đây người ta đo hai mẫu: một mẫu là 28 người bị đái tháo đường và một mẫu
30 người không bị đái tháo đường. Một mẫu bị đái tháo đường, một mẫu không
bị đái tháo đường. Câu hỏi đặt ra là thông tin y học trên có đúng với hai mẫu DL
về đái tháo đường trong bài này không? Tức là những kết luận lúc nãy và với hai
mẫu DL này thì những thông tin trên có đúng với hai mẫu DL về đái tháo đường
trong bài toán này không?
13. GV: Bây giờ để trả lời câu hỏi đặt ra. Các bạn hãy cho biết chúng ta phải giải
quyết bài toán gì?
14. GV: Các bạn thảo luận và cho biết ý kiến. Bạn nào cho ý kiến?
15. SV: Thưa thầy, chúng ta phải KĐ giả thuyết thống kê về trung bình để trả lời
câu hỏi nồng độ HbA1c ở những người bị đái tháo đường có cao hơn nồng độ
HbA1c ở những người không bị đái tháo đường không.
16. GV: Tức là bạn nói bài toán KĐ giả thuyết thống kê là so sánh hai số trung bình
của mẫu bị đái tháo đường và mẫu không bị đái tháo đường qua nồng độ
HbA1c. Bạn nào có bổ sung gì nữa không?
17. GV: Để giải quyết bài toán so sánh hai trung bình, đề nghị các bạn thảo luận và
đưa ra các bước thực hiện.
− SV1: Nói chung là phải tính các thông số cần thiết rồi dùng phép kiểm t.
− SV2 : Phải tính trung bình và phương sai mẫu trước đã.
− Giờ đưa ra phương pháp giải:
− SV1 : Xem 2 mẫu có PPC không? Sau đó nếu có PPC rồi thì so sánh hai
phương sai. Để so sánh hai phương sai thì phải tính F.
− SV1: Mẫu nhỏ thì dùng phép kiểm t.
− SV2: Có cần phép kiểm chi bình phương ở đây không ?
− SV1 ghi:
2
s,
Xem 2 mẫu có PPC không?
2 s 1
2
:σ
Nếu có PPC, so sánh hai phương sai
Nếu hai phương sai đồng nhất thì tính
Dùng phép kiểm t
− SV1 lật giáo trình trang 142-143, sau đó tiếp tục ghi:
Giả thuyết H: là nồng độ ở người đái tháo đường > nồng độ ở người bình
thường.
2-1)s2 2
1 = σ
2 =
1-1)s2 1+(n 1+n n 2-2
A x
(n σ = σ
E
AαE(n
1+n
2-2)
E E E E E E A t =E ~ tE
1- x 2 1 n 1
σ + 1 n 2
18. GV nhắc: Chúng ta chưa cEần giải bài toán, mà chỉ nêu các bước giải.
− SV1: n ở đây là bao nhiêu ?
− SV2: là cỡ mẫu đó.
− SV1: Thầy có đưa ra công thức rồi.
(SV1 lật vở xem lại kiến thức)
− SV1: Vậy mình phải tính các thông số cần thiết, sau đó so sánh. Có máy tính
không?
SV2 lấy máy tính trong túi xách. Trong khi đó các SV nhóm bên cạnh đã bắt
đầu nhập DL vào máy tính.
− SV2 nhập DL vào máy tính, SV1 theo dõi. Sau đó SV1 ghi kết quả
,= 1X 7 989
. SV1 tỏ ý thắc mắc.
− SV2: Cứ ghi đi.
− SV2 nhâp DL vào máy tính để tính s, SV1 đọc DL cho SV2 nhập.
,=
2 247
. − SV2 đọc kết quả, SV1 ghi vào giấy s
− SV1: Tính cho nhóm 2 nữa đúng không ?
− SV1 đọc DL cho SV2 nhập vào máy và tính. Máy tính báo lỗi, không ra kết
quả. SV2 tự đọc DL và nhập.
µ ≥ µ
H
:
o
1
2
µ < µ
:
H 1
1
2
− SV1 ghi vào giấy trong lúc SV2 đang tính:
2-1)s2 2
1 = σ
2 =
1+(n 1-1)s2 1+n n 2-2
A x
(n σ = σA
AαE(n
E
1+n
2-2)
E E E E E E A ~ tE t =E
1- x 2 1 n 1
=
=
;
,
,
7 047 s 1 810
σ + 1 n 2
− SV2 đọc kết quả: x
19. GV chEo SV dừng làm việc nhóm. Thời điểm là 10h20’
20. GV: Bây giờ mời hai nhóm đại diện cho lớp trình bày các bước giải quyết bài
toán đặt ra ở đây là gì? Mời một bạn nhóm này.
21. SV trình bày: Các bước giải quyết bài toán này là
Bước 1: Chúng ta phải kiểm tra tính chuẩn của hai mẫu DL. Tính
X X, 1
2
=
=
trung bình:
n
; 28 n
30
1
2
nên đây là mẫu nhỏ, chúng ta thực hiện Bước 2: Vì
phép kiểm student. Trước hết ta kiểm tra tính đồng nhất của phương
sai và sử dụng phép kiểm student một đuôi để so sánh hai trung bình.
Từ kết quả của phép kiểm đó ta thực hiện bước thứ 4 là so sánh với
thông tin y học
GV mời một đại diện của nhóm khác.
22. SV trình bày: Theo những DL của bài toán trên thì nhóm em xin đưa ra kết quả
,
là:
, n n s s , 2
1
1
2
Bước 1: Tính các thông số cần thiết như
2X X, 1
. Bước 2: KĐ tính chuẩn của DL đối với biến
oH : DL có PPC.
- Đặt giả thuyết
oH thì mình chuyển bước 3.
- Nếu chấp nhận
Bước 3: So sánh 2 phương sai.
- Đặt giả thuyết hai phương sai khác nhau không có ý nghĩa
- Nếu chấp nhận giả thuyết, tức là hai phương sai đồng nhất, thì mình sẽ
2X X, 1
tiếp tục so sánh hai giá trị trung bình bằng phép KĐ t 1 đuôi.
23. GV: Cám ơn 2 bạn đại diện cho lớp. Có bạn nào có ý kiến gì thêm không? Các
bước các bạn đưa ra như vậy có phù hợp chưa?
24. Một SV bổ sung: DL ban đầu phải đưa vào các khoảng, chia thành các khoảng
nồng độ.
25. GV: Bạn bổ sung thêm là phải đưa DL về bảng ghép lớp, đúng không? Đó là
một ý kiến. Còn bạn nào có ý kiến gì nữa không?
26. GV: Như vậy chúng ta không có ý kiến gì thêm. Tôi tạm kết lại các bước mà các
bạn đưa ra nhé! Một bạn có một ý kiến khác so với hai nhóm đã phát biểu là DL
đã cho phải chia thành khoảng, đúng không? Vậy mục đích chia để làm gì và
chia như thế nào? Có thể trả lời được không?
27. SV trình bày: Chia để thực hiện KĐ tính chuẩn của DL bằng phép kiểm chi bình
phương. Chia sao cho số người trong khoảng đó phải lớn hơn hoặc bằng 5
28. GV: Bạn nhớ nhầm sang điều kiện thực hiện phép kiểm chi bình phương rồi.
phép kiểm chi bình phương chỉ có hiệu lực tốt khi tần số lý thuyết n’ lớn hơn
hoặc bằng 5.
Bây giờ tôi sẽ tổng kết lại các bước mà các bạn vừa đưa ra.
29. GV chiếu slide tổng kết các bước thực hiện bài toán KĐGTTG
30. GV: Áp dụng cho bài toán so sánh hai trung bình
- Bước 1: tính tham số mẫu như trung bình, phương sai
- Bước 2: KĐ tính chuẩn của DL
- Bước 3: nếu DL có PPC thì thực hiện so sánh hai phương sai. Nếu hai phương
sai giống nhau thì thực hiện phép kiểm t để so sánh hai trung bình. Và chọn
phép kiểm phù hợp một đuôi hay hai đuôi.
Trong bài chúng ta chọn một đuôi hay hai đuôi?
31. SV đồng thanh: một đuôi.
32. GV: Tại sao một đuôi?
33. SV: Vì bài hỏi lượng HbA1c của nhóm này có cao hơn nhóm kia không.
34. GV: Trường hợp DL không chuẩn thì thực hiện hoán chuyển và thực hiện các
bước lại từ đầu. Bây giờ chúng ta thử thực hiện bước một.
35. GV: Làm cách nào để chúng ta thực hiện được bước 1? Nhập DL vào máy, đúng
không? Bây giờ, vấn đề còn lại là bước 2, KĐ tính chuẩn, thông thường chúng ta
dùng kĩ thuật nào, phương pháp nào để KĐ tính chuẩn của DL?
36. SV đồng thanh: phép kiểm chi bình phương.
37. GV: Trong bài này sử dụng chi bình phương có được không? Nếu được thì thực
hiện như thế nào?
38. SV1 lật giáo trình, trang 160, 161 (Chu Văn Thọ và tgk, 2011)
39. GV: À, phép kiểm chi bình phương. Chúng ta thử xem trong bài này nếu cho DL
thô như vậy thì chúng ta dùng phép kiểm chi bình phương có được không? Tại
sao được? Tại sao không? Bạn nào có ý kiến?
40. SV1 trả lời: Được
GV: Mời 1 SV.
41. Một SV trình bày: Theo em thì mình có thể sử dụng phép kiểm chi bình phương
từng điểm.
42. GV: phép kiểm chi bình phương từng điểm là như thế nào nhỉ? Bạn có thể nói rõ
hơn không? Trong giáo trình, trong bài học ở lớp có bài toán dạng đó hay
không?
SV không có câu trả lời.
43. GV: Có một bạn đưa ra một ý kiến về chia khoảng ghép lớp, chia khoảng thì bạn
nói là có sai số, nó sẽ bị mất mát thông tin, đúng không? Vì từ DL thô ban đầu
chuyển qua dạng bảng ghép lớp sẽ bị mất mát thông tin. Còn bạn đề nghị một
phương pháp là dùng DL điểm nhưng không có kỹ thuật để thực hiện.
44. GV: Vậy có khả thi hay không?
45. SV đồng thanh: Không ạ.
46. GV: Đề nghị các bạn có ý kiến khác? Tích cực hơn nào. Tức là kĩ thuật phép
kiểm chi bình phương ở đây có sử dụng được hay không?
47. SV trình bày: Theo em, dùng phép kiểm chi bình phương là được. Vì ở đây đề
cho cỡ mẫu là 28 và 30 mà KĐ chi bình phương phải chia khoảng DL gốc thành
bảng DL ghép lớp. Nếu sử dụng bảng số liệu gốc sẽ dài.
48. GV: Bạn nói sử dụng phép kiểm chi bình phương để KĐ tính chuẩn mà chúng ta
từng biết là khả thi nhưng DL ở đây người ta cho là DL gốc, không có bảng DL
ghép lớp nên khó thực hiện đúng không?
49. SV: Theo em nghĩ là nên chia DL thành từng lớp là khả thi hơn.
50. GV: À, chia bảng hả? Cuối cùng cũng về chia bảng. Chia làm sao? Kĩ thuật chia
DL thô thành DL ghép lớp có được học hay không? Giáo trình có phần nào cung
cấp kỹ thuật chia bảng DL hay không?
51. SV: Dạ không, nhưng mà không chia thì làm thế nào nhỉ?
52. SV: Dạ thưa thầy, trong bài giảng thì không có nhưng trong giáo trình em thấy
người ta chia bảng mỗi khoảng thường cách nhau 5 đến 10 đơn vị.
53. GV: Các phép kiểm và ví dụ trong giáo trình, sau khi thu thập DL thô, người ta
đã chia sẵn thành bảng ghép lớp nhưng không cung cấp kỹ thuật chia bảng cho
chúng ta. Như vậy cuối cùng kết luận ra sao? Có thực hiện được phép kiểm chi
bình phương hay không?
54. SV: Nếu phương pháp chia bảng chưa học thì không thực hiện được phép kiểm
chi bình phương ở đây.
55. GV: À, như vậy là không thực hiện được. Bước 2 của bài toán KĐ yêu cầu phải
KĐ tính chuẩn của DL bằng phép kiểm chi bình phương nhưng với DL thô thì
chưa có kỹ thuật để thực hiện. Như vậy, chúng ta gặp khó khăn ở chỗ này. Để
khắc phục điều này trong thực tế người ta phải có một biện pháp khác, đó là
dùng phép kiểm Shapiro trong phần mềm R.
56. GV giới thiệu phần mềm R (10h35’). Các bạn coi trên màn hình về kĩ thuật KĐ
tính chuẩn của DL bằng phép kiểm shapiro trong phần mềm R.
GV hướng dẫn SV sử dụng phần mềm R, các SV làm theo hướng dẫn của GV.
A, kết luận 0E
thì chấp nhận giả thuyết HA 0 05,> 57. GV: Theo quy tắc KĐ, nếu trị số p
DL có PPC và ngược lại.
10h50’ SV thực hiện KĐ, 10h55’ GV hỏi kết quả.
58. GV: Chúng ta KĐ thì kết quả như thế nào nhỉ?
0E
59. SV: Bác bỏ HA
60. GV : Đối với DL về lượng HbA1c của người bị đái tháo đường thì p < 0,05
0?
đúng không? Nhỏ hơn 0,05 thì chấp nhận hay bác bỏ H
0, tức là DL về lượng HbA1c của người đái tháo đường có PPC
61. SV : Bác bỏ H 0. 62. GV: Bác bỏ H
hay không?
63. SV: Dạ, không.
64. GV: Còn DL về lượng HbA1c của người không bị đái tháo đường?
65. SV: Có PPC
66. GV: Có. Như vậy ở đây một mẫu DL có PPC, một mẫu không có PPC. Với kết
quả KĐ tính chuẩn của DL thì có thỏa điều kiện của phép kiểm t không?
67. SV: Không thỏa.
68. GV: Không thỏa là do điều kiện gì? Mình có thể so sánh hai trung bình của một
biến có PPC và một biến không có PPC với nhau không?
69. Một SV: Phải hoán chuyển DL.
70. GV: Trong trường hợp DL không có PPC, thì mình phải làm thế nào?
Có 3 phương pháp thực hiện như sau. Phương pháp thứ nhất là tăng cỡ mẫu lên vì
theo định lý giới hạn trung tâm trong giáo trình, khi cỡ mẫu càng lớn thì DL sẽ có
PPC. Ví dụ ở đây cỡ mẫu là 28 và 30 phải không ? Tăng cỡ mẫu nhiều lên rồi mình
kiểm lại xem DL có PPC không. Bao giờ có PPC thì thôi. Như vậy phương pháp đó,
các bạn thấy có khả thi không?
71. SV: Không.
72. GV : Tại sao không khả thi
73. SV : Tại vì làm XN trên nhiều người hơn thì tốn tiền hơn.
74. GV: Đúng rồi. Thứ nhất là tốn thời gian thực hiện, thứ hai là đối với những xét
nghiệm y học có những xét nghiệm rất đắt tiền. Vừa tốn kém về thời gian, vừa
tốn kém về kinh phí thực hiện XN nên phương pháp tăng DL không khả thi,
đúng không?
75. GV: Phương pháp thứ hai là sử dụng những phép kiểm không đòi hỏi điều kiện
DL có PPC, phương pháp đó người ta gọi KĐ phi tham số, nhưng chúng ta
không được học, cho nên phương pháp KĐ phi tham số cũng không khả thi.
76. GV: Phương pháp thứ 3 là người ta hoán chuyển DL về PPC bằng một số hàm
toán học như hàm mũ, hàm căn bậc hai nhưng thông thường nhất là hàm
logarith. Ở đây tôi sẽ minh họa cho các bạn cách hoán chuyển DL bằng hàm
logarith. Tôi sẽ thực hiện hoán chuyển DL đối với mẫu thứ nhất, còn một mẫu
thứ hai thì các bạn tự làm nhé!
GV minh họa bằng cách hoán chuyển DL
77. GV: Đặt một biến để đón nhận giá trị mà nó hoán chuyển. Ví dụ ở đây đã đặt X,
Y rồi thì giờ mình đặt là Z. Đây, chỉ cần một câu lệnh này thôi
SV thực hiện theo hướng dẫn của GV
> Z1 <- c (log(X1))
> shapiro.test (Z1)
Vì p value lớn hơn 0,05 và theo lý thuyết thì sau hoán chuyển, DL Z1 có PPC.
78. GV: Các bạn làm tương tự với mẫu thứ hai.
79. SV1: Chuẩn rồi mà.
80. SV2: Mình phải chuyển cả hai mẫu vì nếu chỉ chuyển một mẫu thì nó không
cùng đơn vị.
81. SV1: Vậy chứ hoán chuyển cái gì?
SV2 gõ giúp SV1 lệnh hoán chuyển.
82. GV: Để tính trung bình và độ lệch chuẩn của hai mẫu DL đã hoán chuyển nhập
câu lệnh:
> mean (Z1)
[1] 2,045068
> sd (Z1)
[1] 0,2540067
GV yêu cầu SV ghi lại kết quả. SV thực hiện tương tự với mẫu 2.
83. GV: Các bạn thấy DL có PPC không?
84. SV: Có
85. GV: Có PPC. Vì p value lớn hơn 0,05 và theo lý thuyết thì DL Z2 đã hoán
chuyển có PPC. Như vậy đã thỏa hai điều kiện của KĐ t chưa?
86. SV: Dạ rồi.
87. GV: chúng ta thực hiện được so sánh hai trung bình chưa?
88. SV: Dạ rồi.
GV: Rồi. Bây giờ chúng ta sẽ làm bước tiếp theo là so sánh hai trung bình. Tôi sẽ
phát cho mỗi bạn một tờ giấy, giống như tờ giấy thi, các bạn ghi họ tên và làm bài
trong đó.
SV làm việc cá nhân
89. Một SV hỏi bài. SV1 trả lời: KĐ DL có PPC, phép kiểm t, quên, KĐ phương sai
xem có đồng nhất không chứ, sau đó so sánh hai trung bình.
90. SV3: Giờ chỉ KĐ phương sai thôi hả?
91. SV1: Ừ.
SV ghi lại các kết quả đã KĐ (trên slide trình chiếu) vào giấy làm bài.
SV2 dùng Excel, dùng hàm FINV: =finv(27;29;0,05). Kết quả máy báo NUM!
SV2 tham khảo bảng trang 246, 247, rồi trao đổi với bạn kế bên và chỉnh lại.
= finv(0,05;27;29)
Máy báo kết quả là 1,875131
92. SV2: 29 hay 39?
Sau một lát suy nghĩ, SV2 sửa lại là: = finv(0,05;27;39)
Máy báo kết quả là 1,77363
SV2 vẫn tiếp tục thắc mắc: 27, 29 hay 27, 39?
SV2 thử nghiệm: = finv(0,05;29;27). Máy báo kết quả là 1,875131
SV2 ghi kết quả vào giấy làm bài
93. GV: Giá trị ngưỡng đối với phép kiểm t một đuôi thì lấy giá trị này: 1,890674 và
1,672552 (có trình chiếu)
94. SV1: Số trên hay dưới?
95. SV2 thắc mắc: 29, 27 hay 27, 29?
96. SV1: 29, 27 đúng rồi.
oH . SV1 nhắc SV2 sửa lại.
SV1 kiểm tra lại bài và sửa lại: Vì T c> ⇒ bác bỏ
µ ≤ µ
H
o
2
: 1 µ > µ
:
H 1
1
2
2 SV làm xong bài, SV1 tiếp tục kiểm tra lại bài và sửa lại:
11h30’ GV yêu cầu lớp trưởng thu bài.
=
=
=
;
,
0 254 n
;
,
28
X 2 045068 s 1
1
1
=
=
=
0 27 n
30
X 1 917 s ,
;
;
,
2
2
2
97. GV gọi một SV lên bảng trình bày. SV trình bày như sau:
Ước lượng:
;
X 1
S 1
X
;
µ = 1 µ = 2
2
σ = 1 σ = 2
S 2
2
2
H : σ khác nhau không ý nghĩa.
2σ :
o
2
1σ và
=
=
<
=
F
, 1 1299 F
, 29 27
, 1 89
(
)
, 0 05
2
2 σ 1 σ
2
* KĐ so sánh
oH
2
−
+
n
(
(
1
) 1 S 2
2 σ =
=
⇒ chấp nhận
, 0 068
n
n 2 − 2
) 2 1 S 1 ( + n
− )
1
2
H : µ ≤ µ : đúng,
o
1
2
H : µ > µ 1 2
1
2
=
=
t
1 869 ,
2
+
σ
1 n
1
2
− X X 1
=
=
v
25
1 672 ,
1 n )
(
α
= c T 2
t
c< (sau đó SV sửa lại là t
c> )
*
oH
⇒ bác bỏ
Vậy: nồng độ HbA1C của người tiểu đường cao hơn người bình thường.
98. GV yêu cầu SV tổng kết các bước.
99. GV thực hiện pha thể chế hóa.
Buổi thực nghiệm kết thúc lúc 11h40’
PHỤ LỤC 6
Bài toán 1 và 2 của thực nghiệm chương 5
Bài toán 1: Kết quả XN nồng độ HbA1c (%) trên hai nhóm:
Nhóm 1: Gồm 27 bệnh nhân bị tiểu đường type 2:
6.4, 6.4, 5.4, 6.0, 6.2, 8.1, 1.6, 7.1, 7.4, 6.1, 7.2, 7.2, 6.6, 7.9, 6.5, 6.8, 8.4, 7.5, 6.6,
7.7, 5.9, 7.6, 7.3, 10.6, 6.6, 6.1, 5.6.
Nhóm 2: Gồm 27 người bình thường (không bị tiểu đường):
5.1, 5.3, 5.0, 5.5, 5.5, 5.7, 5.4, 5.6, 5.4, 5.1, 5.3, 6.2, 5.9, 5.1, 5.3, 5.8, 5.9, 6.0, 6.2,
5.3, 5.4, 5.0, 5.1, 5.3, 6.9, 5.9, 5.6.
Câu hỏi: Nồng độ HbA1c của những người bị tiểu đường (nhóm 1) có cao
hơn nồng độ này ở những người bình thường không (nhóm 2)? (α =0,05)
Bài toán 2: Một nghiên cứu nhằm so sánh nồng độ lysozyme giữa hai nhóm
bệnh nhân. Nhóm 1 gồm 29 bệnh nhân, nhóm 2 gồm 30 bệnh nhân tuổi từ 20 đến
60. Số liệu như sau: (Nguyễn Văn Tuấn, 2010)
Nhóm 1: 0.2, 0.3, 0.4, 1.1, 2.0, 2.1, 3.3, 3.8, 4.5, 4.8, 4.9, 5.0, 5.3, 7.5, 9.8,
10.4, 10.9, 11.3, 12.4, 16.2, 17.6, 18.9, 20.7, 24.0, 25.4, 40.0, 42.2, 50.0, 60.0.
Nhóm 2: 0.2, 0.3, 0.4, 0.7, 1.2, 1.5, 1.5, 1.9, 2.0, 2.4, 2.5, 2.8, 3.6, 4.8, 4.8, 5.4,
5.7, 5.8, 7.5, 8.7, 8.8, 9.1, 10.3, 15.6, 16.1, 16.5, 16.7, 20.0, 20.7, 33.0.
Câu hỏi: So sánh nồng độ Lysozyme trung bình trong hai nhóm trên (α =0,05)
PHỤ LỤC 7
PHIẾU SỐ 1 VÀ 2
PHIẾU SỐ 1
(Bài toán 1 và 2 của thực nghiệm chương 6)
1 ng/ml) của một mẫu 44 người bị ung thư tiền
Bài toán 1: Lượng PSA (X
liệt tuyến (KT) có di căn như sau:
6.0, 7.3, 8.5, 8.9, 9.5, 11.9, 10.2, 11.3, 11.5, 11.4, 11.2, 12.5, 12.9, 13.0, 14.0, 13.8,
12.9, 14.8, 15.0, 15.5, 15.8, 15.7, 16.0, 15.0, 16.0, 16.2, 17.1, 18.0, 17.8, 16.9, 16.5,
2 ng/ml) của 27 người bị KT chưa di căn như sau:
17.4, 17.9, 18.5, 19.4, 19.6, 18.7, 18.3, 21.0, 22.5, 26.0, 29.1, 25.6, 25.8 Lượng PSA (X
8, 9, 9.1, 9.2, 9.5, 9.8, 10.7, 10.8, 11.2, 11.7, 11.8, 12.3, 12.5, 12.9, 13, 14, 14.5,
14.7, 15.5, 16, 16.4, 16.9, 17, 18, 19.1, 21, 21.8
1 = 15,747; s
1 = 5,051 và X
2 = 13,57; s
2 = 3,769
Tính được: X
Hỏi: Lượng PSA của người KT có di căn có cao hơn lượng PSA của người KT
chưa di căn không? (α = 0,05)
Bài toán 2: Nồng độ HbA1c của 28 người bị đái tháo đường type 2
12.2, 8.2, 5.9, 6.1, 8.3, 9.5, 6.3, 9.3, 7.5, 6.6, 7.8, 6.3, 7.7, 7.3, 6.5, 5.5, 6, 14.9, 7.5,
8.3, 7.4, 8.8, 12, 7.9, 10.9, 6.1, 5.1, 7.8
Nồng độ HbA1c của 30 người bình thường (không bị đái tháo đường)
8.1, 5.3, 5.0, 5.8, 9.5, 5.4, 10.0, 4.5, 8.8, 5.9, 6.2, 10.3, 7.1, 7.5, 9.2, 4.3, 8.8, 7.1,
6.4, 7.5, 7.3, 4.3, 10.1, 6.7, 9.3, 4.8, 5.8, 7.3, 8.2, 4.9
1 = 7,898; s
1 = 2,246 và X
2 = 7,047; s
2 = 1,86
Tính được: X
Hỏi: Nồng độ HbA1c của người bị đái tháo đường type 2 có cao hơn nồng
độ này ở người bình thường không? (α = 0,05)
HẾT
E(69) = 1,994; tE
A0,05
A0,05E(56) = 2; tE
A0,1E(69) = 1,667; tE
A0,1E(56) = 1,672
E A A A A Cho biết: t
A0,05E(27; 29) = 1,875; FE
A0,05E(43; 26) = 1,843
A A FE
PHIẾU SỐ 2
XÉT NGHIỆM PSA VÀ UNG THƯ TIỀN LIỆT TUYẾN
Hiện nay, dấu hiệu sinh học được dùng rộng rãi nhất trong tầm soát và phát
hiện ung thư là xét nghiệm tìm PSA (prostate-specific antigen: kháng nguyên đặc
hiệu tuyến tiền liệt) trong máu nam giới cao tuổi, để tầm soát ung thư tiền liệt tuyến.
Xét nghiệm PSA là xét nghiệm đơn giản, dễ thực hiện và tương đối chính
xác. Xét nghiệm này dùng để phát hiện một loại protein được phóng thích từ tiền
liệt tuyến vào máu. Xét nghiệm này được dùng song hành với việc khám tiền liệt
tuyến bằng ngón tay qua trực tràng.
Điều quan trọng nhất thường thấy là những người bị ung thư tiền liệt tuyến
có lượng PSA cao hơn so với những người không bị bệnh ung thư. Giá trị PSA càng
cao thì càng có khả năng mắc bệnh ung thư tiền liệt tuyến. Hơn nữa, mức PSA trong
máu càng có xu hướng tăng khi ung thư tiền liệt tuyến lan sang các cơ quan khác (di
căn) (Vũ Văn Vũ, 2011)