BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

ĐÀO HỒNG NAM

DẠY HỌC XÁC SUẤT - THỐNG KÊ

Ở TRƯỜNG ĐẠI HỌC Y

LUẬN ÁN TIẾN SĨ KHOA HỌC GIÁO DỤC

TP. HỒ CHÍ MINH, 2014

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

ĐÀO HỒNG NAM

DẠY HỌC XÁC SUẤT - THỐNG KÊ

Ở TRƯỜNG ĐẠI HỌC Y

Chuyên ngành : Lý luận và phương pháp dạy học bộ môn Toán

Mã số

: 62.14.01.11

LUẬN ÁN TIẾN SĨ KHOA HỌC GIÁO DỤC

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS. TS LÊ THỊ HOÀI CHÂU

PGS.TS ALAIN BIREBENT

TP. HỒ CHÍ MINH, 2014

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết

quả nêu trong luận án là trung thực và chưa từng được ai công bố trong bất kì công

trình nào khác.

Tác giả luận án

MỤC LỤC

MỤC LỤC

DANH MỤC CÁC BẢNG

DANH MỤC HÌNH ẢNH, SƠ ĐỒ

CÁC TỪ, CỤM TỪ VIẾT TẮT TRONG LUẬN ÁN

MỞ ĐẦU .................................................................................................................... 1

1. LÝ DO CHỌN ĐỀ TÀI ....................................................................................... 1

1.1. Vai trò của Xác suất – Thống kê trong y học ............................................... 1

1.2. Xác xuất – Thống kê trong đào tạo cán bộ y tế ở Việt Nam ........................ 3

1.3. Tổng quan về tình hình nghiên cứu trên chủ đề "DH Xác suất –Thống kê" ...... 5

1.4. Định hướng nghiên cứu của chúng tôi ........................................................ 11

2. LỰA CHỌN CÔNG CỤ LÝ THUYẾT ............................................................ 12

3. MỤC TIÊU, PHƯƠNG PHÁP VÀ NỘI DUNG NGHIÊN CỨU .................... 12

4. GIẢ THUYẾT KHOA HỌC ............................................................................. 16

5. NHỮNG LUẬN ĐIỂM CẦN BẢO VỆ ............................................................ 16

6. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN ....................................................... 17

7. CẤU TRÚC LUẬN ÁN .................................................................................... 18

CHƯƠNG 1. CƠ SỞ LÝ LUẬN ............................................................................ 19

1.1. DIDACTIC TOÁN ...................................................................................... 19

1.1.1. Tổng quan về các công cụ lý thuyết đặc trưng của Didactic Toán .......... 20

1.1.2. Hợp thức hóa ngoại vi và hợp thức hóa nội tại........................................ 21

1.2. YẾU TỐ MÔI TRƯỜNG TRONG DIDACTIC TOAN ............................. 25

1.3. THUYẾT NHÂN HỌC TRONG DIDACTIC TOÁN ................................ 26

1.3.1. Tri thức và thể chế ................................................................................... 27

1.3.2. Sự chuyển hóa sư phạm (transposition didactique) ................................. 27

1.3.3. Quan hệ thể chế và quan hệ cá nhân với một đối tượng tri thức ............. 29

1.3.4. Tổ chức toán học: một công cụ phân tích quan hệ thể chế ...................... 30

1.3.5. Tổ chức didactic: một công cụ phân tích thực hành DH của GV ............ 32

1.4. HỢP ĐỒNG DH .......................................................................................... 35

1.5. SAI LẦM VÀ HỢP ĐỒNG DH .................................................................. 37

1.6. ĐỒ ÁN DH .................................................................................................. 38

1.6.1. Khái niệm đồ án DH ................................................................................ 38

1.6.2. Chức năng kép của đồ án DH .................................................................. 39

1.6.3. Các pha khác nhau của việc nghiên cứu một đồ án DH ......................... 39

1.7. PHÂN TÍCH TRI THỨC LUẬN TRONG DIDACTIC TOÁN ................. 42

1.7.1. Về thuật ngữ phân tích tri thức luận ........................................................ 42

1.7.2. Lợi ích của phân tích tri thức luận ........................................................... 43

1.8. VẤN ĐỀ MÔ HÌNH HÓA TRONG DH TOÁN ........................................ 46

1.8.1. Về các thuật ngữ mô hình hóa, mô hình và mô hình toán học ................ 46

1.8.2. Quá trình mô hình hóa ............................................................................. 47

1.9. KẾT LUẬN chương 1 ................................................................................. 49

CHƯƠNG 2. XÁC SUẤT – THỐNG KÊ VÀ Y HỌC TỪ TOÁN HỌC

ĐẾN NHỮNG NGHIÊN CỨU THỰC TIỄN ĐẦU TIÊN ........... 50

2.1. NHỮNG ỨNG DỤNG CƠ BẢN CỦA XS-TK TRONG

NGHIÊN CỨU Y HỌC ............................................................................... 51

2.1.1. Chọn mẫu ................................................................................................. 52

2.1.2. Ước lượng khoảng tin cậy và kiểm định giả thuyết thống kê.................. 52

2.1.3. Tương quan và hồi quy ............................................................................ 53

2.1.4. Các mô hình nghiên cứu trong y học ....................................................... 54

2.2. THỰC TIỄN SỬ DỤNG XS-TK: MỘT SỐ SAI LẦM TÌM THẤY ............ 60

2.2.1. Không đảm bảo nguyên tắc lấy mẫu........................................................ 60

2.2.2. Bỏ qua điều kiện của các phép kiểm định ............................................... 61

2.2.3. Biến đổi và phân nhóm biến số không theo quy luật ............................... 64

2.2.4. Sai sót trong phân tích tương quan .......................................................... 64

2.2.5. Ý nghĩa thống kê và ý nghĩa lâm sàng ..................................................... 66

2.2.6. Thiết kế nghiên cứu không có nhóm chứng ............................................ 67

2.3. XS-TK TRONG CHẨN ĐOÁN – ĐIỀU TRỊ ............................................... 69

2.3.1. Độ chính xác của một XN ....................................................................... 69

2.3.2. Giá trị tiên đoán ....................................................................................... 72

2.3.3. Mô hình ngưỡng ...................................................................................... 72

2.4. MỘT NGHIÊN CỨU THỰC TIỄN DẠY HỌC MÔ HÌNH NGƯỠNG ....... 74

2.4.1. Các praxéologie cần dạy .......................................................................... 74

2.4.2. Phân tích thực tế DH ................................................................................ 78

2.5. KẾT LUẬN CHƯƠNG 2 ............................................................................... 81

CHƯƠNG 3. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÀ PHÂN PHỐI

CHUẨN: MỘT PHÂN TÍCH TRI THỨC LUẬN ....................... 83

3.1. PHÂN TÍCH TRI THỨC LUẬN VỀ KIỂM ĐỊNH GIẢ THUYẾT TK ....... 83

3.1.1. Kiểm định giả thuyết thống kê trong lịch sử ......................................... 85

3.1.2. Mô hình kiểm định giả thuyết thống kê được sử dụng trong y học

hiện nay ................................................................................................. 90

3.2. PHÂN TÍCH TRI THỨC LUẬN VỀ PHÂN PHỐI CHUẨN ....................... 91

3.2.1. Lịch sử hình thành khái niệm PPC .......................................................... 92

3.2.2. Các giai đoạn nảy sinh và phát triển ...................................................... 102

3.2.3. Phạm vi tác động, bài toán và đối tượng liên quan ............................... 105

3.3. KẾT LUẬN CHƯƠNG 3 ............................................................................. 106

CHƯƠNG 4. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÀ PHÂN

PHỐI CHUẨN: MỘT NGHIÊN CỨU THỂ CHẾ .................. 108

4.1. XS-TK TRONG CHƯƠNG TRÌNH ĐÀO TẠO NGÀNH Y ...................... 110

4.1.1. XS-TK trong chương trình khung do Bộ Giáo dục và Đào tạo quy định .... 110

4.1.2. Chương trình XS-TK ở Đại học Y dược Tp HCM ............................... 111

4.2. PHÂN TÍCH GIÁO TRÌNH V1 VÀ SÁCH BÀI TẬP V2 .......................... 113

4.2.1. PPC trong XS ......................................................................................... 114

4.2.2. PPC trong ước lượng khoảng tin cậy ..................................................... 118

4.2.3. PPC trong KĐ giả thuyết TK nói chung ................................................ 119

4.2.4. PPC trong bài toán KĐ giả thuyết TK về hai tỷ lệ ................................ 122

4.2.5. PPC và bài toán KĐ giả thuyết về hai trung bình .................................. 127

4.2.6. Những tổ chức toán học liên quan đến KĐ giả thuyết TK .................... 133

4.2.7. Nhận xét về phần KĐ giả thuyết TK trong V1 và V2 ........................... 134

4.3. CÁC ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IF, O) ......................... 135

4.3.1. Những điểm giống nhau ........................................................................ 136

4.3.2. Những điểm khác nhau .......................................................................... 137

4.4. Các ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IA, O) .......................... 144

4.4.1. Sự giống nhau ........................................................................................ 146

4.4.2. Sự khác nhau .......................................................................................... 147

4.5. KẾT LUẬN CHƯƠNG 4 ............................................................................. 150

CHƯƠNG 5. NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA

GIẢNG VIÊN VÀ QUAN HỆ CÁ NHÂN CỦA SINH

VIÊN VỚI ĐỐI TƯỢNG O ......................................................... 152

5.1. NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA GIẢNG VIÊN ............... 152

5.1.1. TỔ CHỨC TOÁN HỌC CẦN DẠY VÀ ĐƯỢC DẠY ........................ 153

5.1.2. TỔ CHỨC DIDACTIC .......................................................................... 153

5.2. THỰC NGHIỆM KIỂM CHỨNG GIẢ THUYẾT KHOA HỌC ................ 162

5.2.1. Mô tả thực nghiệm ................................................................................. 162

5.2.2. Phân tích tiên nghiệm ............................................................................ 163

5.2.3. Phân tích tiên nghiệm bài toán 1............................................................ 166

5.2.4. Phân tích tiên nghiệm bài toán 2............................................................ 169

5.2.5. Phân tích hậu nghiệm ............................................................................. 172

5.3. KẾT LUẬN CHƯƠNG 5 ............................................................................. 173

CHƯƠNG 6. CÁC GIẢI PHÁP SƯ PHẠM VÀ NGHIÊN CỨU

THỰC NGHIỆM ......................................................................... 175

6.1. CƠ SỞ ĐỀ XUẤT GIẢI PHÁP ................................................................... 175

6.1.1. Cơ sở lí luận ........................................................................................... 175

6.1.2. Kết quả phân tích tri thức luận .............................................................. 175

6.1.3. Kết quả phân tích quan hệ thể chế, quan hệ cá nhân ............................. 176

6.2. CÁC GIẢI PHÁP SƯ PHẠM ...................................................................... 176

6.2.1. Giải pháp 1 ............................................................................................. 176

6.2.2. Giải pháp 2 ............................................................................................. 176

6.2.3. Giải pháp 3 ............................................................................................. 177

6.2.4. Giải pháp 4 ............................................................................................. 177

6.2.5. Giải pháp 5 ............................................................................................. 177

6.3. NHỮNG KẾT QUẢ CHỦ YẾU RÚT RA TỪ PHÂN TÍCH TRI THỨC

LUẬN VỀ KĐ GIẢ THUYẾT TK .............................................................. 178

6.4. XÂY DỰNG ĐỒ ÁN ................................................................................... 179

6.4.1. Các bài toán cơ sở của đồ án ................................................................. 179

6.4.2. Dàn dựng kịch bản ................................................................................. 180

6.4.3. Phân tích tiên nghiệm bài toán 1 và 2 .................................................... 181

6.5. PHÂN TÍCH HẬU NGHIỆM ...................................................................... 182

6.5.1. Tình huống 1 ......................................................................................... 184

6.5.2. Tình huống 2 .......................................................................................... 188

6.5.3. Tình huống 3 .......................................................................................... 190

6.6. KẾT LUẬN CHƯƠNG 6 ............................................................................. 191

KẾT LUẬN CỦA LUẬN ÁN ............................................................................... 192

DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ .......................................... 194

DANH MỤC TÀI LIỆU THAM KHẢO ............................................................. 195

A. Tiếng Việt .................................................................................................... 195

B. Tiếng Anh .................................................................................................... 200

C. Tiếng Pháp ................................................................................................... 203

DANH MỤC CÁC BẢNG

Bảng 2.1. Nồng độ CRP ............................................................................................ 53

Bảng 2.2. Kết quả thử nghiệm vaccine cúm ............................................................. 59 Bảng 2.3. Hàm lượng huyết sắc tố và Na+ trước và sau mổ ...................................... 62

Bảng 2.4. Kết quả XN máu và nước tiểu ................................................................. 71

Bảng 3.1. Các mức ý nghĩa giữa năm 1837 và 1908 ................................................ 87

Bảng 4.1. Phân phối chương trình XS-TK .............................................................. 112

Bảng 4.2. Bảng phân phối XS của biến ngẫu nhiên X ............................................ 114

Bảng 4.3. Các kiểu nhiệm vụ và kỹ thuật liên quan đến phép kiểm u và t ............. 133

Bảng 4.4. Phân phối chương trình XS-TK trong V1 và F ...................................... 136

Bảng 4.5. Sự khác nhau giữa 3 giáo trình V1, F và A ............................................ 150

Bảng 5.1. Kết quả TK các chiến lược được sử dụng .............................................. 173

Bảng 6.1. Kết quả thực nghiệm bài toán 1 và 2 ...................................................... 184

DANH MỤC HÌNH ẢNH, SƠ ĐỒ

Sơ đồ 1.1. Hệ thống tối tiểu cần nghiên cứu ............................................................. 20

Sơ đồ 1.2. Tác động phản hồi của môi trường ......................................................... 26

Sơ đồ 1.3. Sự chuyển hóa sư phạm giữa các cấp độ tri thức .................................... 27

Hình 1.1. Các mảnh ghép trên miếng bìa hình chữ nhật ........................................... 40

Sơ đồ 1.4. Quá trình mô hình hóa ............................................................................. 49

Hình 2.1. Mô hình ngưỡng P - K .............................................................................. 73

Hình 3.1. Phân phối chuẩn ....................................................................................... 86

Sơ đồ 4.1. Phân bố các phép kiểm trong V1 ........................................................... 141

Sơ đồ 4.2. Phân bố các phép kiểm trong F .............................................................. 142

Hình 5.1. Biểu đồ nồng độ HbA1c, nhóm 1 ........................................................... 167

Hình 5.2. Biểu đồ nồng độ HbA1c, nhóm 2 ........................................................... 167

Hình 5.3. Biểu đồ nồng độ lysozyme nhóm 1 ......................................................... 170

Hình 5.4. Biểu đồ nồng độ lysozyme nhóm 2 ......................................................... 170

Hình 5.5. DL hoán chuyển Y1 = ln(X1) ................................................................. 171

Hình 5.6. DL hoán chuyển Y2 = ln(X2) ................................................................. 171

CÁC TỪ, CỤM TỪ VIẾT TẮT TRONG LUẬN ÁN

VIẾT TẮT VIẾT ĐẦY ĐỦ

DH Dạy học

DL Dữ liệu

GV Giảng viên

HS Học sinh

KĐ Kiểm định

PPC Phân phối chuẩn

SV Sinh viên

TK Thống kê

XN Xét nghiệm

XS Xác suất

XS-TK Xác suất - Thống kê

tr Trang

Tp HCM Thành phố Hồ Chí Minh

1

MỞ ĐẦU

1. LÝ DO CHỌN ĐỀ TÀI

1.1. Vai trò của Xác suất – Thống kê trong y học

• Y học – một khoa học thực nghiệm không thể thiếu công cụ Xác suất – Thống kê

Bản chất của các chẩn đoán trong y học luôn bao hàm ý nghĩa xác suất (XS).

Khi khám bệnh, thông qua việc khám lâm sàng, bác sĩ sẽ nhận định người đến khám

bị bệnh B với một giá trị XS nào đó, XS này gọi là XS tiền nghiệm. Nếu XS này

vẫn chưa đủ để khẳng định hoặc loại trừ bệnh thì bác sĩ sẽ chỉ định các xét nghiệm

(XN) để hỗ trợ chẩn đoán. Dữ liệu (DL) từ các XN mang lại, từ các dữ kiện y học,

từ kinh nghiệm lâm sàng, từ thông tin của bệnh nhân, … kết hợp với các phương

pháp của xác suất - thống kê (XS-TK) sẽ là cơ sở để đưa ra chẩn đoán đúng và chọn

phương pháp điều trị thích hợp cho bệnh nhân.

Không chỉ thế, các bác sĩ còn phải nghiên cứu và hiểu được các phương pháp

của XS-TK để có thể đánh giá về độ tin cậy của những kết quả được trình bày trong

y văn, áp dụng chúng vào điều trị và chăm sóc bệnh nhân. Họ cần phải biết chẩn

đoán nào là tốt nhất, phương pháp điều trị nào là tối ưu. Họ phải giải thích được các

số liệu thống kê (TK) mô tả tình trạng sức khỏe dân số,… Những công việc kể trên

chỉ là một phần nhỏ trong công việc hàng ngày của bác sĩ mà ở đó kiến thức về XS-

TK luôn cần thiết.

Đối với các nhà nghiên cứu y học, XS-TK cũng là mảng kiến thức không thể

thiếu. Chẳng hạn, trong dịch tễ học, một ngành khoa học nghiên cứu về sức khỏe và

bệnh tật của con người, XS-TK được sử dụng để xác định, tìm hiểu và đánh giá các

yếu tố nguy cơ, nguyên nhân gây bệnh, xác định chính sách y tế cộng đồng,…

Tóm lại, cũng như mọi khoa học thực nghiệm khác, các thành tựu của y học

đều là những kết quả nghiên cứu được hình thành từ việc điều tra hay thử nghiệm

trên một (hoặc một số) mẫu rút ra từ tổng thể. Đặc trưng đó khẳng định vai trò quan

trọng của XS-TK trong y học.

2

• Vai trò của XS - TK trong Y học thực chứng

Thế nhưng, cái chân lý tưởng như hiển nhiên này không phải là đã được thừa

nhận sớm trong y học.

Suốt nhiều thế kỷ qua cho đến hiện nay, quá trình và phương pháp chẩn đoán,

điều trị bệnh chủ yếu dựa trên mô hình của Aristotle (Nguyễn Văn Tuấn, 2004).

Theo mô hình này, người thầy thuốc khám lâm sàng dựa trên những triệu chứng mà

bệnh nhân mô tả, sau đó dự đoán khả năng bệnh nhân mang bệnh B nào đó với một

XS ban đầu (XS tiền nghiệm), rồi quyết định phương pháp điều trị. Nếu sau điều trị,

bệnh diễn tiến tốt hoặc khỏi hoàn toàn thì phương pháp điều trị đã thực hiện được

xem là đúng. Qua nhiều lần điều trị, người thầy thuốc sẽ rút ra kinh nghiệm cho

mình và truyền thụ cho đồng nghiệp. Như vậy, phương pháp điều trị theo mô hình

Aristotle chủ yếu dựa trên kinh nghiệm và người thầy thuốc thường có khuynh

hướng chủ quan vì cảm nhận rằng phương pháp điều trị của mình là tốt, là tối ưu,

Nhiều phương pháp trị liệu hiện hành không có hiệu nghiệm như chúng ta tưởng.

Thậm chí, trong quá trình điều trị, người thầy thuốc còn có thể gây nên thương tổn cho

bệnh nhân. Nhưng đó không phải là vấn đề. Vấn đề là những kinh nghiệm của bác sĩ

rút ra từ kinh nghiệm quan sát lâm sàng hàng ngày thường không có độ tin cậy cao.

Thêm vào đó, phần lớn các phương pháp chữa trị trong y học chưa bao giờ được kiểm

tra, đánh giá bằng các phương pháp khoa học. Những phương pháp này được dùng vì

bác sĩ tin rằng chúng có hiệu nghiệm, và cũng như mọi niềm tin tôn giáo, nó không

dựa vào bằng chứng khoa học. (Nguyễn Văn Tuấn, 2004)

mặc dù có bằng chứng khoa học chứng minh điều ngược lại.

Sự thiếu căn cứ khoa học xác đáng của phương pháp truyền thống dựa vào mô

hình Aristotle đã dẫn đến việc hình thành nên một phương pháp khác, đó chính là

phương pháp y học thực chứng (Evidence-based medicine) (Beth Dawson, Robert

G.Trapp, 2004)

Gần đây, y học thực chứng đã và đang trở thành một cuộc cách mạng trong

nghiên cứu y học, trong chẩn đoán và điều trị bệnh. Đây là một phương pháp thực

hành y khoa không chỉ dựa vào kinh nghiệm mà còn dựa vào các DL y khoa đã

3

được TK lại hoặc đã được công bố trên các tạp chí có uy tín về y học, kết hợp giữa

Mặc dù còn nhiều ý kiến khác nhau, về y học thực chứng nhưng sự hiện diện và phát

triển của phong trào y học thực chứng, tự nó, đã nói lên một sự thật là trong thời đại

thông tin, những người hành nghề y khoa không còn là những anh hùng hào hiệp như

thủa xa xưa. Những thuật chữa trị ngoạn mục ngày càng ít đi. Penicillin cho bệnh sưng

màng óc, streptomycin cho bệnh lao, salk vaccine cho bệnh Polio, v.v… chỉ là những

viên đạn huyền diệu của quá khứ. Ngày nay, chúng ta chết không phải vì bệnh lao, vì

bệnh truyền nhiễm, mà vì những bệnh như tim mạch, ung thư, những bệnh do nhiều

yếu tố gây nên, và do đó, không dễ gì có được một viên đạn huyền diệu để chữa trị.

(Nguyễn Văn Tuấn, 2004)

kinh nghiệm lâm sàng với thông tin từ bệnh nhân.

Trong y học thực chứng, việc phân tích DL bằng các mô hình TK đóng một

vai trò then chốt. TK cung cấp cho nhà nghiên cứu một công cụ để phân tích và xử

lí DL, để hiểu và suy diễn ý nghĩa của các sự kiện. Giá trị khoa học và độ tin cậy

của kết luận từ một nghiên cứu không chỉ phụ thuộc vào thiết kế nghiên cứu, mục

đích nghiên cứu, phương pháp đo lường và thu thập DL, … mà còn phụ thuộc một

phần lớn vào việc áp dụng đúng phương pháp TK và các điều kiện cần và đủ của

các phương pháp này.

1.2. Xác xuất – Thống kê trong đào tạo cán bộ y tế ở Việt Nam

Ở nước ta, y học thực chứng chỉ mới được chú ý đến trong thời gian gần đây

và chưa có sự phát triển vững mạnh với những lý do khác nhau. Một mặt, do sự quá

tải của các bệnh viện, bác sĩ ít có thời gian dành cho bệnh nhân, ít có thời gian

nghiên cứu khoa học. Mặt khác, TK học ở nước ta chưa được chú ý và đầu tư đúng

mức, chưa có sự kết hợp giữa người làm TK và người sử dụng TK trong các lĩnh

vực nghiên cứu. Vì những lý do này mà các đề tài nghiên cứu chưa được đánh giá

cao, ít được ứng dụng trong thực tế và ít có cơ hội xuất hiện trên các tập san

quốc tế.

Nhưng, lý do quan trọng hơn cả mà chúng tôi nhận ra trên cương vị một giảng

viên (GV) giảng dạy môn XS-TK ở trường Đại học Y Dược Tp HCM là phương

pháp DH XS-TK còn nặng về kiến thức hàn lâm, chủ yếu xoay quanh các kiến thức

cơ bản, chưa đi sâu khai thác ứng dụng của XS-TK đối với từng chuyên ngành. Hơn

4

thế, theo quy định của chương trình dành cho các trường đại học Y – Dược, XS-TK

được đưa vào giảng dạy từ năm thứ nhất, khi mà hầu như SV chưa được trang bị gì

đáng kể về khối kiến thức y học. Điều đó khiến cho GV khó có thể làm cho SV thấy

rõ vai trò của XS-TK trong chẩn đoán, điều trị và nghiên cứu khoa học. Sự bất hợp

lý này khiến SV vừa thiếu động cơ học tập môn học XS-TK, vừa ít hoặc không có

cơ hội sử dụng XS-TK trong chẩn đoán, điều trị và nghiên cứu.

Hậu quả là nhiều bác sĩ gặp khó khăn khi tiến hành một nghiên cứu y học. Họ

thường phải mời chúng tôi làm tư vấn, thậm chí tham gia nghiên cứu cùng họ, giải

quyết giúp họ khâu phân tích DL.

Khó khăn đó còn được bộc lộ qua nhiều sai lầm tìm thấy trong các công trình

nghiên cứu thuộc lĩnh vực Y học (đã công bố), từ việc chọn mẫu đến việc xử lý DL

và ước lượng hay kiểm định (KĐ) giả thuyết TK. Để minh họa, chúng tôi nêu dưới

đây sai lầm tìm thấy trong một đề tài nghiên cứu khảo sát sự tăng Hcy của bệnh

nhân có huyết khối tắc mạch.

Để so sánh tỷ lệ tăng Hcy giữa 2 nhóm huyết khối động mạch và huyết khối

tĩnh mạch tác giả đề tài đã dựa vào bảng số liệu sau (Bảng 1):

Bảng 1. Tỷ lệ tăng Hcy trên bệnh nhân huyết khối tắc mạch

Bằng cách sử dụng phép kiểm chi bình phương để phân tích DL, tác giả đi đến

kết luận: Tỷ lệ tăng Hcy nhóm huyết khối động mạch cao hơn nhóm huyết khối tĩnh

mạch (p = 0,024).

Theo lý thuyết TK, phép kiểm chi bình phương chỉ có hiệu lực tốt khi có ít

hơn 20% số ô trong bảng tính có tần số lý thuyết nhỏ hơn 5 và không có ô nào có

tần số lý thuyết nhỏ hơn 1. Nếu không thỏa mãn điều này thì phải dùng hiệu chỉnh

Yates hoặc ghép hàng/cột lân cận sao cho tần số lý thuyết không nhỏ hơn 5

(Betty R. KirKwood, 2003).

5

Bảng 1 rơi vào trường hợp này: có một ô có tần số thực nghiệm nhỏ ( in = 0),

in = 11×22/46 = 2,87 < 5). Như vậy, việc thực hiện

dẫn tới tần số lý thuyết rất nhỏ ( '

2

2χ = 3,48 <

hiệu chỉnh Yates là cần thiết. Điều đáng nói là nếu thực hiện hiệu chỉnh Yates thì

0,05 (1)χ

= 3,84 (p = 0,0621) từ đó ta lại có kết luận ngược với tác giả: Tỷ

lệ tăng Hcy nhóm huyết khối động mạch và nhóm huyết khối tĩnh mạch khác nhau

không ý nghĩa. Ngoài ra, đề tài này còn vi phạm một nguyên tắc khác khi dùng phép

kiểm chi bình phương: phép kiểm này chỉ được sử dụng đối với những biến định

tính độc lập, không thể sử dụng cho các biến định lượng.

Sai lầm trên chỉ là một trong những loại sai lầm không phải là hiếm thấy trong

các công trình nghiên cứu y học. Điều đó minh chứng cho khó khăn của nhiều nhà

nghiên cứu khi cần sử dụng XS-TK. Chính vì thế, việc tìm ra những sai lầm điển

hình thường gặp là một phần nghiên cứu thực tiễn mà chúng tôi sẽ trình bày đầy đủ

hơn trong chương 2 của luận án.

Những ghi nhận về vai trò của XS-TK trong y học và khó khăn của các bác sĩ

khi cần sử dụng XS-TK vào nghiên cứu cũng như vào hoạt động nghề nghiệp

thường ngày của họ đã khiến chúng tôi lựa chọn đề tài Dạy học Xác suất - Thống kê

ở trường Đại học Y.

1.3. Tổng quan về tình hình nghiên cứu trên chủ đề "DH Xác suất –Thống kê"

DH XS-TK luôn là một chủ đề được nhiều nhà nghiên cứu quan tâm. Liên

quan đến chủ đề này, với những tư liệu tìm hiểu được, chúng tôi thấy có ba xu

hướng nghiên cứu gắn với ba mục đích:

- Giúp người học nhìn thấy quan hệ gắn bó mật thiết giữa XS và TK

- Giúp người học hiểu được nghĩa của các khái niệm cơ bản trong XS-TK

- Giúp người học phát triển tư duy TK

Thực ra thì ba xu hướng nghiên cứu này không tách rời nhau. Nhìn thấy mối

liên hệ giữa XS với TK được xây dựng trên cơ sở hiểu nghĩa của tri thức: nó được

sinh ra để giải quyết vấn đề gì ? có quan hệ ra sao với các tri thức khác ? Rồi chính

việc hiểu nghĩa của tri thức, hiểu quan hệ giữa XS với TK lại là nền tảng để hình

thành tư duy TK, theo đó người học phải biết phương pháp phân tích DL, ý thức

6

được sự rủi ro (risk) hay độ tin cậy (confidence) của những kết luận rút ra từ mẫu,

Giảng dạy thống kê không chỉ nhắm vào các công thức hoặc là các biểu đồ. Thống kê

không chỉ là một tập hợp các kĩ thuật, đó là sự rèn luyện tư duy, một cách để nắm bắt

dữ liệu, đặc biệt là biết được sự tồn tại của những cái không chắc chắn, sự thay đổi của

thông tin và việc thu thập dữ liệu. Nó cho phép đưa ra quyết định trong những tình

huống không chắc chắn. (Bair, Hasbroeck, 2002)

từ đấy thấy được vai trò của việc chọn mẫu:

Gắn với ba xu hướng đó người ta thường nói đến vấn đề mô hình hóa trong

DH XS-TK. Điều này hoàn toàn tự nhiên, vì hai lẽ: thứ nhất, XS-TK là một khoa

học ứng dụng, nên nói đến XS-TK thì phải nói đến mô hình hóa toán học (quy trình

giải quyết một vấn đề ngoài toán học bằng công cụ toán học); thứ hai, muốn người

học hiểu nghĩa của tri thức cần dạy, muốn phát triển tư duy TK thì phải gắn tri thức

với vấn đề mà việc sử dụng nó mang lại một lời giải tối ưu chứ không thể trình bày

tri thức một cách hình thức.

Vì có rất nhiều công trình bàn về chủ đề DH XS-TK nên trong khuôn khổ có

hạn của luận án và với nguồn tư liệu có được chúng tôi chỉ điểm qua dưới đây một

số công trình đại diện cho ba xu hướng này.

• Một số công trình của tác giả nước ngoài

- Henry M. (1994) có khá nhiều bài viết về chủ đề DH XS-TK. Các công trình của

ông tập trung bàn đến việc DH các tính toán XS ở bậc trung học từ ba quan điểm –

lịch sử, tri thức luận và didactic. Cách tiếp cận của ông nhằm mục đích giúp người

học nắm được nghĩa của khái niệm, tránh việc dạy những kiến thức hình thức.

- Coutigno C. (2001) trong khuôn khổ luận án tiến sĩ của mình đã xem xét vấn đề

đưa vào ngay từ bậc trung học cơ sở các tình huống ngẫu nhiên, trong đó có sự tác

động của mô hình hóa và giả lập với phần mềm Cabri-géomètre 2.

- Brousseau G., Brousseau N. & Warfield G (2002) đã nghiên cứu một tình huống

cơ sở để đưa vào khái niệm XS ở trường phổ thông, trong đó có tính đến yếu tố

ngẫu nhiên.

7

- Briand J. (2005), nghiên cứu một tình huống tiếp cận các luật ngẫu nhiên ở bậc

trung học phổ thông. Tình huống đó giúp người học nhận ra những yếu tố thiết lập

nên quan hệ giữa XS với TK.

- Wozniak F. (2005), với luận án tiến sĩ "Conditions et contraintes de

l’enseignement de la statistique en classe de seconde générale. Une repérage

didactique" nghiên cứu việc DH TK ở lớp đầu cấp trung học cơ sở của Pháp. Thừa

nhận rằng đào tạo tư duy TK là một vấn đề mấu chốt, tác giả xem xét những điều

kiện và những ràng buộc mà người giáo viên phải chịu trong thực hành DH các nội

dung của TK. Câu hỏi mà tác giả đặt ra để nghiên cứu là "tại sao các điều kiện, các

ràng buộc rất khác nhau trong nhiều thể chế mà thực tế DH thì hầu như đều thiên về

việc rút gọn TK vào các tính toán số học ?".

- Chevallard Y. và Wozniak F. cũng có một số bài báo tập trung vào chủ đề DH XS-

TK ở bậc trung học, chẳng hạn như Enseigner la statistique au secondaire, entre

genre prochaine et différence spécifique(2005), Enseigner la statistique en seconde:

un problème de la profession (2006), ...

- Artaud M. (1993) với luận án tiến sĩ "La mathématisation en économie comme

problème didactique - Une étude exploratoire" đã thực hiện một phân tích lịch sử

toán học và kinh tế học để chỉ ra rằng việc tạo ra các tri thức kinh tế thường gắn liền

với những cuộc điều tra toán học (được thực hiện một cách thỏa đáng), sau đó là

truyền bá các kết quả điều tra, và công việc thứ hai này không phải là đơn giản.

Nghiên cứu đó cho thấy quan hệ mật thiết giữa kinh tế học với toán học, đặc biệt là

với lý thuyết XS-TK. Từ ghi nhận này, tác giả xem xét lại công tác đào tạo ở các trường đại học kinh tế ở Pháp, xét từ góc nhìn của lý thuyết Chuyển hóa sư phạm1.

Susan Miles (2010) với bài báo "Statistics teaching in medical school:

Opinions of practising doctors", đã điều tra quan điểm của bác sĩ lâm sàng và cho ta

1 Đây là một lý thuyết được nhà nghiên cứu người Pháp Y. Chevalard đặt nền móng từ những năm 80 của thế kỷ trước, và hiện nay đã được thừa nhận, được phát triển rộng rãi trên thế giới. Trong chương 1 của luận án chúng tôi sẽ giới thiệu một vài khái niệm cơ bản của lý thuyết này.

thấy có rất ít bác sĩ sử dụng được những kiến thức và kĩ năng TK mà họ đã được

8

học ở bậc đại học. Hơn nữa, nhu cầu đào tạo TK cho bác sĩ đã thay đổi do những

tiến bộ trong công nghệ thông tin và sự gia tăng tầm quan trọng của phương pháp y

học dựa trên chứng cứ. Từ đó tác giả khuyến cáo phải cải tiến phương pháp giảng

dạy cho tương lai.

Đại bộ phận các công trình trên đều bàn về chủ đề DH XS-TK ở bậc trung

học. Đối với bậc đại học, công trình của Artigue M. nhấn mạnh việc thiết lập quan

hệ giữa XS với TK trong đào tạo ngành kinh tế, còn nghiên cứu của Susan Miles

cũng chỉ mới là một điều tra thực tiễn để làm rõ nhu cầu phải thay đổi phương pháp

DH XS-TK ở các đại học Y.

Ngoài hai công trình của Artaud M. và Susan Miles, chúng tôi được biết có dự

án LOE bắt đầu được triển khai ở Đại học Joseph Fourier của Cộng hòa Pháp từ

năm 2011. Mục đích của dự án là thiết kế một trang web dùng cho việc đào tạo ở

trường Đại học Y (thuộc Đại học Joseph Fourier), nhằm hình thành ở SV năng lực

thực hiện một nghiên cứu y học (từ bước xác định vấn đề nghiên cứu, xây dựng

phương pháp nghiên cứu, đến thu thập DL, phân tích DL, rồi viết bài báo khoa học)

và năng lực đọc có phê phán một bài báo của y học. Với tư cách là thành viên của

dự án, vừa qua, trong Hội thảo quốc tế về Didactic Toán tổ chức tại Đại học Sư

phạm Tp HCM, hai nhà nghiên cứu NEY M. và Bessot A. đã trình bày một phân

tích so sánh hai cuốn giáo trình XS-TK được sử dụng ở Đại học Y Dược Tp HCM

và Đại học Joseph Fourier. Xin được nói rõ rằng chúng tôi cũng là thành viên

nghiên cứu tham gia dự án này.

• Một số công trình của tác giả Việt Nam

Nếu như nhiều nước trên thế giới đã đưa XS-TK vào dạy cho học sinh phổ

thông từ ít nhất là vài chục năm nay, thì ở Việt Nam lần đầu tiên, kể từ năm học

2006 -2007, mảng kiến thức này mới được đề cập một cách tương đối có hệ thống

trong chương trình môn toán giảng dạy đại trà bậc trung học phổ thông. Chính vì

thế mà DH XS-TK trở thành một chủ đề được một số nhà nghiên cứu quan tâm.

Đã có nhiều công trình nghiên cứu của các tác giả Việt Nam bàn về chủ đề DH

XS-TK ở trường phổ thông như Trần Kiều (1988), Đỗ Mạnh Hùng (1993), Vũ Như

9

Thư Hương (2011), Trần Túy An (2007), Lê Thị Hoài Châu (2010a, 2010b, 2012,

2013), Trần Lương Công Khanh (2013), Nguyễn Thị Tân An (2013).

Trần Kiều (1988) nghiên cứu nội dung và phương pháp dạy TK mô tả trong

chương trình toán cải cách ở trường phổ thông cơ sở Việt Nam, xác định những

hình thức tổ chức giảng dạy thích hợp với thực tiễn và DH toán ở Việt Nam.

Đỗ Mạnh Hùng (1993) đã tổng kết kinh nghiệm nghiên cứu của các nhà sư

phạm trong và ngoài nước về giáo dục TK toán và lý thuyết XS ở trường phổ thông,

phương án về nội dung và phương pháp DH “một số yếu tố của lý thuyết XS” cho

HS chuyên toán bậc phổ thông trung học Việt Nam.

Vũ Như Thư Hương (2011) nghiên cứu việc DH TK ở lớp đầu cấp trung học

phổ thông nhằm mục đích giúp học sinh nhìn thấy một số yếu tố cho phép thiết lập

quan hệ giữa XS và TK, thấy được ảnh hưởng của việc chọn mẫu. Phân tích chương

trình, sách giáo khoa toán lớp 10, lớp 11 của tác giả cho thấy việc DH XS và TK ở

Việt Nam hoàn toàn tách rời nhau. Từ phân tích tri thức luận, tác giả đã chỉ ra ba bài

toán ứng viên cho việc thiết lập quan hệ này, rồi lấy một trong ba bài toán đó làm cơ

sở để thiết kế một đồ án DH.

Trần Túy An nghiên cứu thực hành giảng dạy khái niệm XS. Nghiên cứu này cho thấy dù ý đồ DH của thể chế2 song ngữ Pháp-Việt và thể chế DH đại trà của

Việt Nam có nhiều điểm khác nhau, GV trong cả hai thể chế đều chỉ thu gọn khái

niệm XS vào định nghĩa cổ điển.

Nguyễn Thị Tân An thiên về vấn đề mô hình hóa trong DH học XS-TK ở

trường phổ thông. Còn tác giả Lê Thị Hoài Châu (2012) thì qua một chùm đề tài

nghiên cứu đã cố gắng làm rõ quan hệ giữa XS với TK, nghĩa của một số khái niệm

cơ bản, những chướng ngại, khó khăn của việc chiếm lĩnh một số khái niệm, … để

nhấn mạnh tầm quan trọng của mô hình hóa trong DH.

Liên quan đến bậc đại học có luận văn thạc sỹ của Tăng Minh Dũng (2010) và

2 Thuật ngữ « thể chế » sẽ được chúng tôi giải thích trong chương 2.

bài báo của Lê Thị Hoài Châu (2013). Tuy nhiên, đối tượng mà hai tác giả này quan

10

tâm là vấn đề đào tạo giáo viên toán về mảng XS-TK nói chung, về tri thức "biểu

đồ" nói riêng.

Ngoài ra, một số luận án tiến sĩ của các tác giả như Phạm Văn Trạo (2009), Tạ

Hữu Hiếu (2010), Phan Thị Tình (2011), Ngô Tất Hoạt (2011), Trần Thị Hoàng

Yến (2011), Hoàng Nam Hải (2013),… cũng đã tập trung vào vấn đề dạy học XS-

TK cho SV các trường cao đẳng và đại học.

Phạm Văn Trạo (2009) nghiên cứu vai trò, tác dụng, mục đích, nguyên tắc, nội

dung, cách thức biên soạn và chuẩn bị tổ chức các tiên đề chuẩn bị tiềm năng DH

XS-TK cho SV toán Đại học Sư phạm.

Tạ Hữu Hiếu (2010) tìm hiểu thực trạng DH môn TK toán học và việc vận

dụng phương pháp TK toán học trong nghiên cứu khoa học cho SV các trường Đại

học Thể dục Thể thao, đồng thời đề xuất một số biện pháp và thực nghiệm sư phạm

để kiểm tra tính khả thi của nó.

Phan Thị Tình (2011) đã trình bày cơ sở lí luận và thực tiễn đối với sự phát

triển của toán học và vấn đề giảng dạy toán cho SV, đề xuất các biện pháp tăng

cường vận dụng toán học vào thực tiễn trong DH môn XS-TK cho SV toán Đại học

Sư phạm.

Ngô Tất Hoạt (2011) đã nghiên cứu đặc điểm, thực tế của kiến thức XS-TK ở

Trường Đại học Sư phạm Kỹ thuật và đề xuất một số biện pháp nhằm bồi dưỡng

các thành tố năng lực kiến tạo kiến thức cho SV.

Với đề tài “Vận dụng DH theo dự án trong môn XS-TK” ở trường đại học

(chuyên ngành kinh tế kỹ thuật), tác giả Trần Thị Hoàng Yến (2011) đã trình bày cơ

sở lý luận và thực tiễn của DH theo dự án, đề xuất quy trình, cách tổ chức và xác

định các nội dung cụ thể khi DH theo dự án trong môn XS-TK.

Hoàng Nam Hải (2013) với đề tài “Phát triển năng lực suy luận TK cho SV

cao đẳng chuyên nghiệp” đã góp phần làm rõ nội hàm của khái niệm suy luận TK;

đề xuất 10 loại hình suy luận TK mà SV cao đẳng chuyên nghiệp thường sử dụng

khi tham gia vào một quá trình hoạt động TK.

11

Một cách tổng quan, chúng tôi thấy hầu hết các tác giả này đều đặt nghiên cứu

của mình vào việc DH XS-TK ở bậc trung học và đại học. Tuy nhiên, đối với bậc

đại học, đối tượng mà các tác giả quan tâm là vấn đề đào tạo giáo viên toán về mảng

XS-TK và việc nâng cao hiệu quả DH XS-TK cho SV các trường không thuộc

chuyên ngành y dược.

1.4. Định hướng nghiên cứu của chúng tôi

Những luận điểm trình bày ở phần 1.1, 1.2, 1.3 giải thích cho việc chúng tôi

chọn Dạy học Xác suất - Thống kê ở trường Đại học Y làm đề tài nghiên cứu. Hơn

nữa, ở cương vị một GV đại học y khoa, bản thân chúng tôi cũng có nhiều trăn trở

về vấn đề DH XS-TK trong tiến trình đào tạo các bác sĩ tương lai.

Rõ ràng là DH XS-TK cho SV y khoa không thể hoàn toàn giống như cho SV

của các trường đại học tổng hợp hay đại học sư phạm. Vấn đề cơ bản là phải đem

lại cho các bác sĩ tương lai những phương tiện để họ thấy được sự cần thiết của XS-

TK đối với y học, và có thể sử dụng XS-TK vào hoạt động nghề nghiệp của mình.

Trong khuôn khổ có hạn của luận án, chúng tôi giới hạn phạm vi nghiên cứu

vào đối tượng KĐ giả thuyết TK, một đối tượng cơ bản, có mặt hầu hết trong các

nghiên cứu y học. Ngoài ra, như chúng tôi sẽ chỉ ra trong luận án của mình, phân

phối chuẩn (PPC) của DL là một điều kiện quan trọng tác động vào bài toán KĐ giả

thuyết TK. Việc không tính đến điều kiện ấy thường dẫn đến những kết luận sai lầm

trong các nghiên cứu y học. Vì thế, liên quan đến bài toán KĐ giả thuyết TK chúng

tôi sẽ đặc biệt quan tâm đến đối tượng tri thức PPC.

Những câu hỏi ban đầu mà chúng tôi mong muốn tìm câu trả lời là: trong thực

tế, liên quan đến đối tượng tri thức KĐ giả thuyết TK nói chung, PPC nói riêng, SV

ngành Y được học gì ? Họ có thể sử dụng các tri thức đó ra sao ? Những sai lầm nào

họ thường phạm phải khi sử dụng ? Hoạt động DH có thể tác động ra sao vào việc

giúp SV nhận ra những sai lầm đó để có thể sử dụng XS-TK vào hoạt động nghiên

cứu và hoạt động nghề nghiệp của họ sau này ?

12

2. LỰA CHỌN CÔNG CỤ LÝ THUYẾT

Chúng tôi đã chọn Didactic Toán (theo trường phái hình thành từ Pháp) với

các công cụ lí thuyết đặc trưng của nó, vì chúng cho phép cụ thể hóa và phát triển

các câu hỏi khởi đầu nêu trên và đặc biệt là tìm được câu trả lời thích đáng cho các

vấn đề đã đặt ra. Cụ thể hơn, chúng tôi sẽ vận dụng các khái niệm chuyển hóa sư

phạm, quan hệ thể chế, quan hệ cá nhân, tổ chức toán học, tổ chức didactic, hợp

đồng DH, môi trường và đồ án DH. Trong chương đầu (Cơ sở lý luận) của luận án

chúng tôi sẽ trình bày rõ các khái niệm này, qua đó giải thích vì sao việc lựa chọn

các công cụ lý thuyết ấy là phù hợp.

Thêm vào đó, chúng tôi còn phải sử dụng khái niệm tri thức luận và mô hình

hóa. Khái niệm tri thức luận cũng sẽ được chúng tôi làm rõ trong chương Cơ sở lý

luận. Mô hình hóa toán học là một công cụ được chúng tôi lựa chọn khi tìm cách cải

tiến thực tế đào tạo theo hướng đặt SV vào hoạt động trong một môi trường có tác

động phản hồi. Quan điểm học tập bằng hoạt động này phù hợp với xu hướng DH

tích cực được hình thành từ Thuyết kiến tạo đang được thừa nhận rộng rãi trên thế

giới. Tuy nhiên, khái niệm mô hình hóa sẽ chỉ được chúng tôi trình bày một cách

tóm lược trong chương Cơ sở lý luận, vì ba lý do. Thứ nhất, khái niệm này đã được

dùng khá phổ biến trong cộng đồng các nhà nghiên cứu và nhà sư phạm, ở ngoài

nước cũng như trong nước. Thứ hai, dù quy trình mô hình hóa luôn hiện diện trong

các tình huống mà chúng tôi thiết kế để DH, nó sẽ không được nhắc đến một cách

tường minh trong phân tích của chúng tôi, vì phân tích đó được thực hiện từ cách

tiếp cận của khái niệm đồ án DH. Lý do thứ ba, thứ yếu, là do số trang quy định

không nhiều cho các luận án.

3. MỤC TIÊU, PHƯƠNG PHÁP VÀ NỘI DUNG NGHIÊN CỨU

Trong khung lý thuyết đã lựa chọn, những câu hỏi khởi đầu của chúng tôi

được chi tiết hóa như sau:

- Đâu là những đặc trưng tri thức luận của KĐ giả thuyết TK ? Vai trò của PPC

trong KĐ giả thuyết TK là gì ?

13

- Đâu là những đặc trưng của quan hệ thể chế với đối tượng KĐ giả thuyết TK nói

chung, PPC nói riêng? Thể chế được chúng tôi xét đến ở đây là thể chế DH XS-TK

ở các trường đại học y khoa.

- Những ràng buộc của thể chế DH ảnh hưởng ra sao đến mối quan hệ cá nhân của

GV và SV đối với PPC và KĐ giả thuyết TK ?

- Trong DH XS-TK, định hướng nào có thể mang lại cho SV y khoa những phương

tiện giúp họ nhận ra sự cần thiết của XS-TK đối với Y học và biết sử dụng nó vào

hoạt động nghề nghiệp của mình ?

Như vậy, mục tiêu của luận án là làm rõ đặc trưng của đối tượng KĐ giả

thuyết TK nói chung, PPC nói riêng cả từ góc độ tri thức luận và sư phạm (trong thể

chế DH XS-TK ở trường Đại học Y Dược Tp HCM, nơi đào tạo nguồn nhân lực y

tế chủ yếu cho toàn bộ Miền Nam), khiếm khuyết trong lựa chọn của thể chế DH và

ảnh hưởng của những lựa chọn (do thể chế thực hiện) trên quan hệ cá nhân của GV

và SV về các đối tượng này, từ đó thiết kế một đồ án sư phạm có thể khắc phục

những khiếm khuyết của quan hệ thể chế ở phía SV.

Thêm vào đó, luận án cũng nhắm tới mục tiêu giới thiệu và minh chứng cho tính

hiệu quả của một số công cụ lí thuyết của Didactic Toán, nhằm làm phong phú hơn

kho tàng Lí luận và Phương pháp DH môn toán ở nước ta.

Để đạt được mục tiêu này, chúng tôi chọn phương pháp luận nghiên cứu như sau:

a) Thực hiện một tổng hợp tri thức luận về đối tượng KĐ giả thuyết TK và

PPC. Để thuận tiện trong trình bày, chúng tôi sẽ gọi đối tượng này là O.

Nghiên cứu tri thức luận sẽ mang lại một tham chiếu cho nghiên cứu thể

chế DH được thực hiện sau đó.

b) Nghiên cứu đặc trưng của các đối tượng tri thức O trong đào tạo cán bộ y

tế tại Đại học Y Dược Tp HCM. Nghiên cứu này được đặt trong phân tích

so sánh với thể chế DH khác - Đại học Y, thuộc Đại học Joseph Fourier –

Cộng hòa Pháp và Đại học Y, thuộc Đại học Nam Illinois (Southern Illinois

University), Hoa Kỳ. Việc đặt trong quan điểm so sánh sẽ cho phép làm rõ

hơn những đặc trưng của quan hệ thể chế chủ yếu mà chúng tôi quan tâm.

14

Phân tích quan hệ thể chế sẽ cho phép chúng tôi dự đoán ảnh hưởng của nó

lên quan hệ cá nhân của GV và SV Y khoa.

c) Nghiên cứu thực nghiệm, tìm hiểu sai lầm của SV khi đứng trước bài toán,

nhằm hợp thức hóa (hay không) những giả thuyết về ảnh hưởng của quan hệ

thể chế lên quan hệ cá nhân của SV. Tuy nhiên, bởi vì mỗi cá nhân có thể

đã, đang tồn tại trong nhiều thể chế khác nhau, chúng tôi sẽ tiến hành một

nghiên cứu quan sát giờ dạy của GV với mục đích tìm hiểu xem thực hành

DH của GV đó có làm giảm bớt đi không, hay ngược lại, củng cố thêm

những khó khăn, sai lầm của SV.

d) Từ các kết quả nghiên cứu trên đề xuất các giải pháp sư phạm và triển khai

thực nghiệm một đồ án DH KĐ giả thuyết TK nhằm kiểm chứng một số

giải pháp đã đề ra.

Tổ chức các nghiên cứu như trên được hình thành trên cơ sở lý luận mà trước

hết chúng tôi cần làm rõ. Ngoài ra, do tính chất mới mẻ của đề tài, chúng tôi cho

rằng việc tìm hiểu vai trò của XS-TK trong y học là cần thiết. Chính từ việc làm rõ

vai trò này, chúng tôi sẽ thực hiện một nghiên cứu bước đầu về những sai lầm

thường gặp (liên quan đến việc sử dụng XS-TK) trong các công trình nghiên cứu y

học và về thực tiễn DH. Các nghiên cứu này một mặt củng cố thêm tính cấp thiết và

ý nghĩa thực tiễn của đề tài, mặt khác cho chúng tôi một cái nhìn tổng quan về thực

tiễn DH XS-TK trong đào tạo cán bộ ngành Y.

Chúng tôi dùng sơ đồ 1 để mô tả mục tiêu và phương pháp luận nghiên cứu đã

lựa chọn.

15

Sơ đồ 1. Mục tiêu và phương pháp luận của luận án

Với mục tiêu và phương pháp luận nghiên cứu đã nêu, chúng tôi xác định nội

dung nghiên cứu của luận án như sau:

• Phân tích và tổng hợp những yếu tố lí thuyết chủ yếu của Didactic Toán để

hình thành cơ sở lí luận cho các nghiên cứu thực hiện trong khuôn khổ luận án.

• Tìm hiểu vai trò của XS-TK trong y học và thực hiện một nghiên cứu khởi

đầu về thực tiễn. Nghiên cứu này được trải ra trên hai phương diện:

- Tìm hiểu những sai lầm thường gặp về việc sử dụng XS-TK trong các công

trình nghiên cứu y học ở Việt Nam

- Quan sát thực hành giảng dạy XS-TK ở Đại học Y Dược Tp HCM.

• Nghiên cứu các đặc trưng tri thức luận của đối tượng O thông qua việc phân

tích lịch sử hình thành và phát triển của O.

16

• Phân tích quan hệ của thể chế (đặt trong quan điểm so sánh) để qua đó làm rõ

"cuộc sống" của O trong DH XS-TK ở Đại học Y Dược Tp HCM.

• Xây dựng và triển khai thực nghiệm tìm hiểu sai lầm của SV khi làm việc với

O, qua đó kiểm chứng giả thuyết về ảnh hưởng của quan hệ thể chế. Việc tìm nguồn

gốc sai lầm còn được thực hiện qua quan sát và phân tích giờ dạy của GV.

• Đề xuất một số giải pháp sư phạm góp phần nâng cao chất lượng DH XS-TK

trong các trường Đại học Y, Dược.

• Thiết kế một đồ án DH và triển khai theo định hướng các giải pháp đã đề nghị,

đồng thời khắc phục những khiếm khuyết của quan hệ cá nhân SV đối với các đối

tượng O.

4. GIẢ THUYẾT KHOA HỌC

Theo cách tiếp cận của Didactic Toán, giả thuyết khoa học không nảy sinh

ngay từ lúc khởi đầu, mà chỉ có thể được hình thành từ những nghiên cứu tri thức

luận và sư phạm. Như chương 3 và chương 4 của luận án sẽ chỉ ra, các nghiên cứu

đó cho phép chúng tôi nêu lên hai giả thuyết khoa học sau:

Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép

giải thích sai lầm của SV:

R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so

sánh hai trung bình thực nghiệm độc lập.

R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung

bình thực nghiệm độc lập.

Giả thuyết 2: SV có thể nhận ra sai lầm của mình thông qua hoạt động giải

quyết các tình huống phá vỡ hợp đồng, được thiết kế theo quan điểm của phương

pháp DH tích cực, trong đó yếu tố môi trường cho phép họ bác bỏ sự vận dụng một

kỹ thuật ở ngoài phạm vi hợp thức của nó.

5. NHỮNG LUẬN ĐIỂM CẦN BẢO VỆ

- Một số kết quả thu được từ bước đầu nghiên cứu thực tiễn sử dụng và DH

XS-TK.

- Đặc trưng tri thức luận của KĐ giả thuyết TK nói chung, của PPC nói riêng.

17

- Đặc trưng thể chế của KĐ giả thuyết TK và PPC

- Những sai lầm gắn với KĐ giả thuyết TK thường gặp ở SV và nguồn gốc

của chúng.

- Một số biện pháp nhằm cải tiến chất lượng đào tạo về XS – TK ở đại học Y –

Dược. Đồ án DH và thực nghiệm kiểm chứng.

6. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN

• Luận án giới thiệu một số công cụ lí thuyết của Didactic Toán, trong sự kết

nối với quan điểm DH tích cực, làm phong phú thêm kho tàng Lý luận và Phương

pháp DH môn Toán ở nước ta.

• Về mặt phương pháp luận, luận án củng cố thêm lợi ích của cách tiếp cận đối

tượng tri thức đã được một vài công trình nghiên cứu công bố gần đây. Cách tiếp

cận này có một số điểm khác so với tiếp cận từ quan điểm của Lí luận và phương

pháp DH toán thường được áp dụng trong nước. Đặc biệt, đó là việc vận dụng phép

biện chứng giữa nghiên cứu tri thức luận với nghiên cứu thể chế và phương pháp

hợp thức hóa nội tại (thay vì cách hợp thức hóa ngoại vi).

• Luận án đã góp phần làm rõ các yếu tố thuộc đặc trưng tri thức luận và thể

chế của một đối tượng tri thức quan trọng luôn hiện diện trong hoạt động nghề

nghiệp và nghiên cứu của các bác sĩ – KĐ giả thuyết TK. Qua đó, luận án cũng đã

chỉ ra ảnh hưởng của sự lựa chọn của thể chế đến hiệu quả đào tạo về XS-TK cho

cán bộ y tế.

• Cuối cùng, luận án đã kiểm chứng tính khả thi và hiệu quả của một đồ án

DH KĐ giả thuyết TK từ quan điểm DH tích cực.

Với những đóng góp trên, chúng tôi hy vọng rằng luận án sẽ là một tài liệu

tham khảo hữu ích cho các nhà lập chương trình đào tạo ngành Y, các tác giả viết

giáo trình XS-TK cho SV Y khoa và cho GV, góp phần nâng cao chất lượng đào tạo

cán bộ y tế.

18

7. CẤU TRÚC LUẬN ÁN

Với những nội dung nghiên cứu đã xác định, luận án được tổ chức trong 6

chương như sau:

- Chương 1: Cơ sở lý luận

- Chương 2: Xác suất thống kê và y học: Từ toán học đến những nghiên cứu

thực tiễn đầu tiên

- Chương 3: Kiểm định giả thuyết thống kê và phân phối chuẩn: một phân tích

tri thức luận

- Chương 4: Kiểm định giả thuyết thống kê và phân phối chuẩn: một nghiên

cứu thể chế

- Chương 5: Nghiên cứu thực hành dạy học của giảng viên và quan hệ cá nhân

của sinh viên với đối tượng O

Chương 6: Các giải pháp sư phạm và nghiên cứu thực nghiệm.

19

CHƯƠNG 1

CƠ SỞ LÝ LUẬN

Chương này dành cho việc trình bày những yếu tố cơ bản nhất làm cơ sở lí

luận cho toàn bộ các nghiên cứu được thực hiện trong luận án. Các phân tích trong

chương được tham khảo từ những tài liệu sau: Chevallard Y. (1985, 1991), Artigue

M. (1992), Brousseau G. (1998), Comiti C. (2004), Đặng Vũ Hoạt (2004), Nguyễn

Bá Kim (2005), Lê Thị Hoài Châu (2001, 2002, 2006, 2011), Nguyễn Phú Lộc

(2007), Lê Văn Tiến (2005), Bessot A. và các tác giả (2009).

1.1. DIDACTIC TOÁN

Didactic Toán, xét với tư cách một khoa học, có thể được dịch là Lý luận và

Phương pháp DH Toán. Tuy nhiên, các nhà nghiên cứu Việt Nam đã không dịch

thuật ngữ này vì muốn nhấn mạnh rằng nó không hoàn toàn đồng nhất với trường

phái Lý luận và Phương pháp DH môn Toán đã phát triển từ lâu ở Việt Nam.

Đối tượng nghiên cứu của Didactic Toán

Giống như Lý luận và Phương pháp DH, Didactic một môn học nghiên cứu

các quá trình truyền thụ và lĩnh hội những nội dung và phương pháp khác nhau của

môn học đó, đặc biệt là trong hoàn cảnh trường học. Didactic Toán có đối tượng

nghiên cứu là các hoạt động DH toán, và cũng nhắm đến mục đích cải tiến thực tiễn

giáo dục. Tuy nhiên, Didactic Toán đặc biệt quan tâm đến việc xây dựng tri thức

Mục đích đầu tiên của Didactic Toán là làm sáng tỏ những điều kiện và những ràng

buộc trong đó việc dạy và học toán được thực hiện. […]

Để nghiên cứu các tình huống xây dựng và hoạt động của kiến thức trong toán học,

các nhà nghiên cứu didactic đặc biệt tính đến:

- những nét đặc thù của tri thức toán học đang bàn đến,

- những đặc trưng và ràng buộc của thể chế dạy học,

- tính phức tạp của tình huống dạy học,

- thực hành dạy học của thầy giáo

- kiến thức ban đầu của học sinh

toán học, đến những điều kiện của việc học tập các kiến thức trong môn Toán.

20

- quá trình tác động qua lại giữa thầy giáo, học sinh và đối tượng kiến thức đưa ra

giảng dạy, trong một tình huống dạy học. (Bessot A. và tgk, 2009, tr. 26)

Với đối tượng nghiên cứu xác định như thế, hệ thống tối tiểu mà Didactic xem

xét được biểu diễn qua sơ đồ gồm bốn yếu tố Thầy giáo, Học trò, Tri thức, Môi

trường (Sơ đồ 1.1).

Sơ đồ 1.1. Hệ thống tối tiểu cần nghiên cứu

Tri thức luôn luôn là yếu tố đầu tiên cần nghiên cứu: không có tình huống dạy

một khái niệm, một định lý chung chung, mà là dạy khái niệm gì, tính chất nào.

Giữa ba yếu tố Thầy giáo, Học trò, Tri thức luôn tồn tại những mối quan hệ

mà để nghiên cứu chúng thì Didactic đã xây dựng nên các công cụ lý thuyết đặc thù

của mình.

Phương pháp nghiên cứu của Didactic Toán

Phương pháp nghiên cứu của Didactic Toán có hai đặc trưng:

- Có những công cụ riêng để mô hình hóa các thành phần của đối tượng

nghiên cứu và mối quan hệ giữa chúng.

- Sử dụng hình thức hợp thức hóa nội tại (chứ không phải là hợp thức hóa

ngoại vi) để chứng tỏ tính thỏa đáng của kết quả nghiên cứu.

1.1.1. Tổng quan về các công cụ lý thuyết đặc trưng của Didactic Toán

Didactic cũng được xây dựng trên cơ sở một số khoa học khác như Tâm lý

học, Giáo dục học, Triết học, … Nhưng thêm vào đó, Didactic tự xây dựng cho

mình những công cụ lý thuyết riêng để mô hình hóa các nhân tố Thầy giáo – Học

trò – Tri thức và mối quan hệ giữa các yếu tố này.

21

Tri thức cần phải dạy đã được quy định bởi chương trình và các văn bản chính

thức. Nó khác với tri thức bác học (là tri thức được cộng đồng các nhà toán học thừa

nhận), vì đã bị biến đổi để có thể dạy được. Didactic có khái niệm chuyển hóa sư

phạm để nghiên cứu những giai đoạn khác nhau của sự biến đổi này, và khái niệm

quan hệ của thể chế đối với tri thức để xem xét sự tồn tại của tri thức trong thể chế.

Những biểu tượng mà thầy giáo có về tri thức phải dạy sẽ đóng một vai trò

quan trọng trong việc lựa chọn cách thức tổ chức mà thầy giáo sẽ làm để tạo ra sự

học tập mong muốn. Những biểu tượng mà HS có về tri thức đó lại chi phối ứng xử

của HS khi làm việc với tri thức. Didactic dùng khái niệm quan hệ cá nhân với đối

tượng tri thức để mô hình hóa kiến thức mà thầy giáo hay HS có về tri thức. Ngoài

ra, kiến thức của HS còn được mô hình hóa bởi khái niệm trường quan niệm.

Khái niệm hợp đồng DH thì được các nhà nghiên cứu didactic xây dựng để mô

hình hóa mối quan hệ Thầy giáo – Học trò – Tri thức. Hợp đồng DH tính đến điều

mà thầy giáo chờ đợi ở HS và điều mà HS chờ đợi ở thầy giáo về một nội dung tri

thức xác định.

Nhằm trả lời cho câu hỏi thầy giáo làm thế nào để xây dựng và tổ chức một

môi trường cho phép nảy sinh ở HS sự thích nghi mong muốn dẫn tới sự hình thành

kiến thức, Didactic có Lý thuyết tình huống.

Như đã nói trong phần Mở đầu, một số trong những công cụ đặc thù của

Didactic Toán sẽ được chúng tôi sử dụng để tiến hành các nghiên cứu thực hiện

trong luận án. Những công cụ này sẽ được giới thiệu có hệ thống hơn ở các

phần sau.

1.1.2. Hợp thức hóa ngoại vi và hợp thức hóa nội tại

Giống như Lý luận và Phương pháp DH, Didactic là một khoa học thực

nghiệm. Cụ thể, những giả thuyết mà nhà nghiên cứu đặt ra sẽ được kiểm chứng

Một trong những đặc trưng của phương pháp nghiên cứu trong didactic là nhờ đến

thực nghiệm, hay nói chính xác hơn là sự vận hành trên hai phương diện – lý thuyết

hoá (lập một hệ thống câu hỏi trong khung tham chiếu) và kiểm chứng bằng thực

nhờ vào thực nghiệm.

22

nghiệm (nghiên cứu tính hợp thức bằng một thực nghiệm cho phép đối chiếu với thực

tiễn). (Bessot A. và tgk, 2009, tr. 25)

Nhưng cách hợp thức hóa (hay kiểm chứng) giả thuyết trong Lý luận và

Phương pháp DH và trong Didactic lại hoàn toàn khác nhau: nếu như lý thuyết thứ

nhất chọn cách hợp thức hóa ngoại vi (validation externe) thì Didactic Toán dùng

hợp thức hóa nội tại (validation interne). • Hợp thức hóa ngoại vi3

Giả thuyết nghiên cứu trong các công trình thuộc chuyên ngành Lý luận và

Phương pháp DH toán thường là giả thuyết về tính khả thi hay hiệu quả của một hệ

thống các giải pháp về DH toán mà nhà nghiên cứu đề xuất. Để kiểm chứng tính

khả thi hay hiệu quả đó, người ta thường tiến hành thực nghiệm triển khai các giải

pháp trên một nhóm đối tượng mẫu, sau đó đánh giá kết quả thực nghiệm so với

một nhóm đối tượng khác (gọi là nhóm đối chứng). Về cơ bản, hai nhóm đối tượng

này có bản chất như nhau, cái khác duy nhất là: trong nhóm đối chứng người ta

không vận dụng các giải pháp mà nhà nghiên cứu đề xuất như trong nhóm thực

nghiệm.

Công cụ đánh giá so sánh hiệu quả của hệ thống giải pháp thường là:

- Kết quả (bằng điểm số) của bài thi, kiểm tra,… được triển khai cả trong

hai nhóm.

- Ý kiến đánh giá của chuyên gia: đánh giá trực tiếp kế hoạch và nội dung các

giải pháp đã đề nghị, hoặc đánh giá qua kết quả triển khai thực hiện trên nhóm

đối tượng thực nghiệm nếu chuyên gia có quan sát việc triển khai thực nghiệm

(như dự giờ lên lớp, phỏng vấn HS,…).

Hợp thức hóa ngoại vi là một phương cách được sử dụng khá phổ biến và

mang lại những hiệu quả nhất định. Tuy nhiên, nó cũng thể hiện một số

3 Về khái niệm này, chúng tôi sử dụng lại phần trình bày của Trần Anh Dũng (2012).

khiếm khuyết.

23

Khiếm khuyết lớn nhất nằm ở việc so sánh kết quả bằng điểm số. Vì bản thân

độ tin cậy của kết quả so sánh điểm số giữa hai nhóm (nhóm thực nghiệm và nhóm

đối chứng) và cả độ tin cậy của điểm số (ngay cả trong nội bộ một nhóm) phụ thuộc

rất nhiều yếu tố, trong đó có nhiều yếu tố vượt ra khỏi phạm vi các giải pháp mà

nhà nghiên cứu đề xuất. Và như vậy, khó có thể đặt niềm tin hoàn toàn vào tính khả

thi của giải pháp hay tính hợp thức của giả thuyết nghiên cứu.

Mặt khác, để gia tăng độ tin cậy của kết quả so sánh, cần phải tiến hành thực

nghiệm trên các tập hợp mẫu khá lớn: tập đối tượng của nhóm thực nghiệm và

nhóm đối chứng.

• Hợp thức hóa nội tại

Cách thức hợp thức hóa một giả thuyết trong Dicdactic Toán là hợp thức hóa

nội tại. Trong hợp thức hóa nội tại, người ta chỉ triển khai thực nghiệm trên nhóm

đối tượng mẫu, và do đó không có sự so sánh kết quả với nhóm đối chứng như

trong hợp thức hóa ngoại vi. Mấu chốt của hợp thức nội tại là thực hiện sự đối

chứng giữa phân tích tiên nghiệm (analyse a-priori) và phân tích hậu nghiệm

(analyse posteriori).

 Phân tích tiên nghiệm

Có nhiều biến can thiệp vào quá trình thiết kế một tình huống thực nghiệm.

Các biến này thường hoạt động theo các phương thức phức tạp đòi hỏi nhà nghiên

cứu phải thực hiện một sự mô hình hóa sơ bộ dựa trên một khung quy chiếu đã

được lựa chọn. Chính trong khung quy chiếu này, nhà nghiên cứu thực hiện một

Một trong những vai trò chủ yếu của phân tích tiên nghiệm là xác định những cái có

thể quan sát được mà thông qua đó hoạt động của hệ thống được thể hiện. Những cái

quan sát được này là đích đáng đối với đối tượng nghiên cứu và ta cần giải thích một

cách hợp lý hoạt động của hệ thống trong khung qui chiếu đã chọn.

(Bessot A. và tgk, 2009, tr. 134)

phân tích tiên nghiệm độc lập với các diễn tiến của thực nghiệm.

Khi phân tích tiên nghiệm, nhà nghiên cứu cần:

- tìm ra những kiến thức chỉ đạo việc thực hiện các chiến lược khác nhau mà

người ta có thể dự kiến được;

24

- nếu có thể thì đánh giá lợi ích cũng như tốn kém của những chiến lược khác

nhau đó;

Để tiến hành phân tích tiên nghiệm và xác định các chiến lược có thể có, nhất thiết

phải:

- phân tích trên phương diện toán học về tri thức đem ra giảng dạy trong tình huống và

về chính tình huống toán học có liên quan;

- xác định môi trường và những tác động phản hồi của nó;

- phân tích chương trình (đôi khi cả sách giáo khoa) để có thể hình thành các giả

thuyết về kiến thức của học sinh và về cách học sinh có thể dùng để giải thích

tình huống; (Bessot A. và tgk, 2009, tr. 145)

- xác định được chiến lược tối ưu và kiến thức tương ứng với chiến lược ấy.

Trong trường hợp thực nghiệm triển khai một đồ án DH, có thể còn phải tính

đến nghiên cứu trước đó về quan niệm, khó khăn và chướng ngại liên quan đến tri

thức cần dạy của HS hay GV.

Qua phân tích tiên nghiệm, nhà nghiên cứu có thể điều chỉnh các biến để tìm

hiểu kiến thức của HS hoặc để nhận được ứng xử mong muốn xuất hiện ở họ.

 Phân tích hậu nghiệm:

Phân tích hậu nghiệm là xem xét mối quan hệ giữa những dữ kiện thu được

trong diễn biến của một tình huống riêng biệt, đồng thời đánh giá và so sánh những

gì quan sát được với các kết quả đã dự kiến trong phân tích tiên nghiệm. Việc đối

chiếu dữ kiện quan sát được với phân tích tiên nghiệm cho phép nhà nghiên cứu xử

lý, giải thích những cái được quan sát và trình bày kết quả muốn nghiên cứu qua

thực nghiệm.

Đặc biệt, phân tích hậu nghiệm phải vạch ra những lựa chọn mà HS đã thực

hiện trong tình huống. Những lựa chọn này sẽ được giải thích như là kiến thức thực

thụ của HS và nghĩa của những câu trả lời của họ. Chính điều đó cho phép hợp thức

(hay không) giả thuyết mà nhà nghiên cứu đặt ra.

Khi phân tích hậu nghiệm nhà nghiên cứu không chỉ quan tâm đến những gì

đã dự kiến, mà còn cần phải đặt câu hỏi về những cái không được dự kiến trước

nhưng đã xẩy ra. Điều này khiến nhà nghiên cứu phải nhìn lại phân tích tiên

25

nghiệm: có những sự kiện với XS xuất hiện thấp đôi khi cho phép phát hiện những

tình huống bị bỏ sót trong lần phân tích tiên nghiệm đầu tiên. Nó cũng cho phép nhà

nghiên cứu thay đổi giá trị của biến để điều chỉnh tình huống đã xây dựng.

Như vậy, phân tích tiên nghiệm không nhất thiết là chỉ thực hiện trước thực

nghiệm: nhà nghiên cứu có thể phải trở đi trở lại xem xét sản phẩm của HS, đối

chiếu nhiều lần giữa những cái có thể quan sát (xác định trong phân tích tiên

nghiệm lần trước) với những cái đã quan sát được (vì có những chiến lược khó dự

kiến trước, hay vì có một số dữ kiện tìm thấy qua quan sát không thể được giải thích

ngay qua lần phân tích tiên nghiệm đầu tiên).

1.2. YẾU TỐ MÔI TRƯỜNG TRONG DIDACTIC TOÁN

Môi trường (milieu) trong Didactic được hiểu là sự mô hình hóa một bộ phận

của hoàn cảnh xung quanh chủ thể trong việc học tập được nhắm đến.

Yếu tố môi trường được tính đến vì Didactic cũng thừa nhận quan điểm của

Thuyết kiến tạo, theo đó tri thức được tạo nên một cách tích cực bởi chủ thể nhận

thức (chứ không phải tiếp thu thụ động từ bên ngoài), và nhận thức là quá trình tổ

chức lại thế giới quan của mỗi người để thích nghi.

Theo quan điểm này, Didactic thừa nhận hai giả thuyết sau về việc học:

- Giả thuyết tâm lí (hypothèse pchsycologique):

Chủ thể học bằng cách tự thích nghi với một môi trường – nhân tố gây ra

những mâu thuẫn, khó khăn và mất cân bằng.

Sự thích nghi này được thực hiện qua các hoạt động đồng hoá và điều ứng.

- Giả thuyết sư phạm (hypothèse didactique):

Một môi trường (environnement) không có chủ ý DH (tức là không được cố ý

tổ chức để dạy một tri thức) không đủ để tạo ra cho chủ thể mọi kiến thức mà xã hội

muốn chủ thể đó lĩnh hội được. Thầy giáo phải xây dựng và tổ chức một môi trường

(milieu) cho phép nảy sinh ở HS những thích nghi mong muốn dẫn tới sự kiến tạo

nên tri thức.

Giữa chủ thể và môi trường có một sự tương tác. Điều này được mô tả qua Sơ

đồ 1.2. Didactic gọi thông tin cụ thể do môi trường cung cấp là tác động phản hồi

26

của môi trường. Thông tin đó được HS tiếp nhận như một sự đánh giá, tích cực hay

tiêu cực, đối với hành động của họ, và cho phép họ điều chỉnh hành động đó, chấp

nhận hoặc gạt bỏ một giả thuyết, chọn một trong nhiều cách giải, v.v…

Sơ đồ 1.2. Tác động phản hồi của môi trường

Môi trường (milieu) này có thể là môi trường vật chất, cũng có thể là môi

trường phi vật chất. Môi trường phi vật chất bao gồm những kiến thức cho phép

người học tự hợp thức hay loại bỏ những quy trình họ đã sử dụng trong quá trình

Môi trường có một vai trò trung tâm trong việc học với tư cách là nguyên nhân của

những sự thích nghi, và trong việc dạy với tư cách là yếu tố qui chiếu.

Một tình trạng kiến thức lúc đó sẽ được đặc trưng bằng trạng thái cân bằng của hệ

thống học sinh - môi trường, đặt dưới những ràng buộc đã xác định rõ ràng.

(Bessot A. và tgk, 2009, tr. 42)

giải quyết vấn đề.

Học chính là quá trình xây dựng một tình trạng cân bằng mới sau khi môi

trường bị xáo trộn hoặc có những ràng buộc tác động lên nó.

1.3. THUYẾT NHÂN HỌC TRONG DIDACTIC TOÁN

Thuyết nhân học (théoie anthroplogique) được Chevalard đề xuất năm 1989

và nhanh chóng trở thành một công cụ hiệu quả của Didactic Toán. Lý thuyết này

đã đưa ra những khái niệm cho phép mô hình hóa quá trình xây dựng một tri thức

và mô hình hóa kiến thức của một cá nhân về tri thức đó. Tư tưởng tổng quát của lý

thuyết là xem một đối tượng tri thức như một sinh vật sống: nó cũng sẽ trải qua

những giai đoạn nảy sinh, tồn tại, phát triển, mất đi và luôn có những mối ràng buộc

với các đối tượng khác.

Những nội dung chủ yếu của Thuyết nhân học là:

- chuyển hóa sư phạm,

27

- quan hệ thể chế và quan hệ cá nhân với một đối tượng tri thức,

- tổ chức toán học và tổ chức didactic.

Ba khái niệm cơ bản lý thuyết là Đối tượng (tri thức), Thể chế và Cá nhân.

Tri thức là kết quả của sự phản ánh thế giới khách quan thông qua hoạt động của chủ

thể nhận thức, là những kinh nghiệm của loài người tích lũy được trong quá trình đấu

tranh với tự nhiên, xã hội và hoạt động tư duy. Những kinh nghiệm đó được các thế hệ

nối tiếp nhau kế thừa một cách có phê phán, phát triển và không ngừng hoàn thiện trên

cơ sở khái quát hóa, hệ thống hóa thành những tri thức của nhân loại.

(Đặng Vũ Hoạt, 2004)

1.3.1. Tri thức và thể chế

Thể chế (institution) là một tập hợp cá thể trong đó có những quy tắc áp đặt

mà mọi thành viên đều phải tuân theo. Một thể chế được gọi là thể chế DH

(institution didactique) nếu tồn tại ít nhất hai vị trí chủ thể (vị trí người dạy, vị trí

người học) và một ý định DH.

Một trong những định đề đầu tiên được thừa nhận trong Thuyết nhân học là:

mỗi tri thức đều là tri thức của một thể chế, và một đối tượng tri thức có thể sống

Một tri thức không tồn tại “lơ lửng” trong một xã hội rỗng: mọi tri thức đều xuất hiện

ở một thời điểm nhất định, trong một xã hội nhất định, như là được cắm sâu vào một

hoặc nhiều thể chế. (Chevallard, 1989)

trong những thể chế khác nhau:

Để tồn tại trong một thể chế, tri thức phải tuân theo những điều kiện ràng buộc

nhất định của thể chế, dẫn đến chỗ phải bị biến đổi cho phù hợp với những ràng

buộc này.

1.3.2. Sự chuyển hóa sư phạm (transposition didactique)

Quá trình chuyển đổi tri thức từ thể chế này sang thể chế kia, trong đó thể chế

đích là thể chế DH, được gọi là quá trình chuyển hóa sư phạm. Đó là quá trình

chuyển hóa gồm ba mắt xích cơ bản (sơ đồ 1.3)

Sơ đồ 1.3. Sự chuyển hóa sư phạm giữa các cấp độ tri thức

28

• Mắt xích thứ nhất: hình thành tri thức bác học

Sự ra đời của một tri thức bác học thuộc mắt xích đầu tiên. Nó là kết quả của

những hoạt động khoa học gắn liền với lịch sử cá nhân của nhà nghiên cứu. Để giải

quyết một vấn đề toán học nào đó, các nhà toán học đã tìm ra những phương pháp,

những kiến thức mới. Sau đó, họ chọn trong số ấy những kiến thức đủ mới, đủ hay,

có thể thông báo cho cộng đồng khoa học. Quá trình khám phá ra một tri thức có thể

khá dài, khá phức tạp, nên để trình bày nó, các nhà toán học phải diễn đạt nó ở dạng

khái quát nhất có thể được, theo những quy tắc thông dụng đang lưu hành trong

cộng đồng khoa học mà không trình bày bài toán dẫn đến việc hình thành tri thức,

không nêu lại quá trình tìm tòi, phát minh của mình, bỏ qua những sai lầm, chướng

ngại gặp phải. Ta nói là nhà toán học đã thực hiện hoạt động phi hoàn cảnh hóa, phi

cá nhân hóa và phi thời gian hóa. Như thế, tri thức mà nhà nghiên cứu thông báo

cho cộng đồng khoa học đã bị biến đổi và việc biến đổi này cũng là một phần quan

trọng của hoạt động toán học. Hoạt động biến đổi tri thức này có mặt tích cực là làm

cho tri thức trở thành tri thức chung, có thể dễ dàng sử dụng và kiểm tra bởi bất kỳ

ai chứ không chỉ bởi các thành viên trong cộng đồng khoa học. Tuy nhiên, hoạt

động đó lại xóa đi lịch sử tìm tòi, khám phá của nhà nghiên cứu, che dấu bài toán

ban đầu là nguồn gốc nảy sinh tri thức, làm cho phát minh trở thành bí ẩn, đặc biệt

là đối với các thế hệ đời sau.

• Mắt xích thứ hai: hình thành tri thức cần dạy

Trong những tri thức toán học được tích lũy qua lịch sử, các nhà thiết kế

chương trình chọn ra một số vấn đề làm đối tượng DH. Để những tri thức này có thể

dạy được cho một bộ phận công chúng, tri thức lại tiếp tục bị biến đổi để phù hợp

với môi trường và hệ thống DH. Các tri thức này được mô tả chính thức trong

chương trình hoặc thể hiện trong sách giáo khoa.

Các nhà biên soạn sách giáo khoa phải trình bày lại những tri thức được chọn

để có thể dạy được cho một bộ phận công chúng xác định, phù hợp với thể chế DH,

đối tượng DH. Để tri thức được sắp xếp theo một một trình tự mà người học có thể

lĩnh hội được, trong một số trường hợp, tác giả phải viết lại các định nghĩa, các tính

29

chất, biến đổi các phép chứng minh, v.v…. Quá trình này có thể tạo ra một số đối

tượng mới. Hệ quả là sự xuất hiện một sự chênh lệch khá lớn giữa tri thức bác học

với tri thức quy định trong chương trình và thể hiện trong sách giáo khoa.

• Mắt xích thứ ba: hình thành tri thức được dạy

Khi tri thức cần dạy đã được xác định, thầy giáo lại phải dựa vào trình độ từng

đối tượng HS, cơ sở vật chất, phương tiện giảng dạy và phương pháp sư phạm của

mình, thầy giáo sẽ chuyển tải những hiểu biết của họ về tri thức đó đến HS sao cho

HS có thể hiểu được. Cách chuyển tải này đương nhiên cũng phụ thuộc vào quan

niệm, vào biểu tượng mà thầy giáo có về tri thức. Và như vậy chuyển hóa sư phạm

Thầy giáo nói chung không dạy nguyên dạng tri thức khoa học hay tri thức chương

trình mà phải chuyển hóa tri thức chương trình thành tri thức dạy học. Nắm vững tri

thức khoa học là một điều kiện cần nhưng chưa đủ để đảm bảo kết quả dạy học.

(Nguyễn Bá Kim, 2005)

tiếp tục xẩy ra trong hệ thống dạy-học.

Như thế, để có thể trở thành tri thức DH, tri thức bác học phải chịu một quá

trình biến đổi theo những ràng buộc của thể chế mà nó đến để sống trong đó. Quá

trình biến đổi này nhiều khi tạo ra một khoảng cách rất lớn giữa tri thức như nó vốn

tồn tại trong cộng đồng khoa học với tri thức trình bày trong sách giáo khoa.

1.3.3. Quan hệ thể chế và quan hệ cá nhân với một đối tượng tri thức

Phân tích trên cho thấy vì sao trong Didactic người ta lại cho rằng yếu tố đầu

tiên cần nghiên cứu không phải là thầy giáo hay HS mà là tri thức cần dạy.

Câu hỏi đặt ra là “tri thức tồn tại ra sao trong thể chế ?”. Khái niệm quan hệ

R(I, O) của thể chế I (rapport institutionnel) đối với tri thức O được Chevalard đưa

vào để mô hình hóa các yếu tố trả lời cho câu hỏi này. Theo Chevalard, quan hệ

R(I, O) cho biết O xuất hiện ở đâu, như thế nào, tồn tại ra sao, có vai trò gì, có mối

quan hệ nào với những đối tượng khác của I, ... Tương tự như vậy, O tồn tại đối với

cá nhân X nếu X biết về O. Quan hệ cá nhân của X đối với O được xem là tập hợp

những yếu tố tác động qua lại mà X có với O (cảm nhận về O, sử dụng O, nói

về O, … ).

30

Khi X hội nhập vào một thể chế DH I, quan hệ R(X, O) sẽ được thiết lập nếu

nó chưa tồn tại hoặc được điều chỉnh, bổ sung nếu nó đã tồn tại. Trong cách hiểu

này, việc học tập của HS về đối tượng tri thức O chính là quá trình thiết lập hay

điều chỉnh mối quan hệ cá nhân đối với O, còn việc dạy của GV thì nhắm tới làm

thay đổi quan hệ cá nhân của HS đối với O.

Hiển nhiên, trong trường hợp I là thể chế DH thì quan hệ R(I, O) luôn để lại

dấu ấn trên R(X, O) – dù X ở vị trí người dạy hay người học. Vì thế mà trong thể

chế này việc nghiên cứu R(X, O) phải gắn liền với việc làm rõ quan hệ R(I, O).

1.3.4. Tổ chức toán học: một công cụ phân tích quan hệ thể chế

Vấn đề là làm thế nào để xác định các yếu tố của R(I, O) ? Thuyết nhân học

trong Didactic Toán cung cấp cho ta một công cụ để làm việc này, đó là khái niệm

praxéologie.

Theo Chevallard, mọi hoạt động xã hội đều được hình thành từ việc giải quyết

một nhiệm vụ xác định t thuộc một kiểu T nào đó. Kiểu nhiệm vụ T được giải quyết

nhờ một kỹ thuật τ - được giải thích, hoặc được tạo ra bởi công nghệ θ. Đến lượt

mình, θ được hợp thức hóa bởi lý thuyết Θ. Lý thuyết Θ lại được giải thích bởi một

lý thuyết khác. Quá trình giải thích này có thể còn tiếp tục vớiΘ và sau đó nữa,

nhưng ít nhất thì với τ, θ, Θ ta đã giải quyết được kiểu nhiệm vụ T với những căn cứ

hợp thức (được một cộng đồng thừa nhận)

Một bộ gồm 4 thành phần [T, τ, θ, Θ] được gọi là một praxéologie. Thuật ngữ

praxéologie được cấu thành từ hai gốc Hy lạp praxis - nghĩa là “thực hành” và

logos - nghĩa là “lí do”, “lập luận”. Thuật ngữ đó nhấn mạnh cấu trúc gồm hai

khối của bộ bốn [T, τ, θ, Θ]: khối thực hành - kỹ thuật [T, τ] và khối công nghệ - lí

thuyết [θ,Θ].

Một praxéologie mà các thành phần đều mang bản chất toán học được gọi là

một praxéologie toán học hay một tổ chức toán học (organisation mathématique),

ký hiệu là OM.

Khái niệm tổ chức toán học mang lại một công cụ để xác định các yếu tố của

quan hệ của thể chế I với một đối tượng tri thức O: Thông qua phân tích chương trình

31

và sách giáo khoa, sách giáo viên, các văn bản chính thức được ban hành về việc DH

tri thức O, nhà nghiên cứu có thể trả lời được hàng loạt câu hỏi: Liên quan đến O,

trong I có những OM nào? Chúng được hình thành từ kiểu nhiệm vụ nào ? Những kĩ

thuật nào được xây dựng ? Kĩ thuật nào được ưu tiên sử dụng ?... Trong các OM đó,

O xuất hiện với tư cách là kỹ thuật để giải quyết kiểu nhiệm vụ nào ? hay nó cho

phép tạo ra kỹ thuật nào ? … Chính việc làm rõ các tổ chức toán học liên quan đến

O sẽ cho phép nhà nghiên cứu vạch rõ mối quan hệ R(I, O) của thể chế I đối với tri

thức O.

Trong trường hợp praxéologie là một OM, ta có thể nói ngay rằng khối công

nghệ - lí thuyết bao gồm những tri thức toán học. Tuy nhiên, một số công trình

“Việc sử dụng các praxéologie thường đi kèm với sự phát triển các yếu tố công nghệ

thực hành, được xây dựng và hợp thức hóa qua ảnh hưởng của hoạt động của các nhà

toán học.” (Castelat, 2012)

nghiên cứu ở Pháp xoay quanh vấn đề giải các bài toán đã chỉ ra rằng:

Theo quan điểm này, Castelat (2008) đề nghị đưa thêm các yếu tố thực hành vào mô hình praxéologie, bằng cách phân biệt thành phần thực hành θp của

θ

 ,T   

th ,  Θθ τ ,  p  

công nghệ.

Nếu như thành phần lý thuyết θth tạo thành từ những kết quả được hợp thức hóa nhờ một lý thuyết, thì θp lại được hợp thức qua kinh nghiệm và không theo hệ thống toán học4. Thành phần θp này có thể lúc đầu được một (hay một nhóm)

chuyên gia xây dựng, nhưng sau đó được thể chế hóa nhờ những quá trình làm việc

tập thể đã kéo các nhà thực hành vào giải quyết những nhiệm vụ thuộc kiểu T, sau

“nhu cầu mô hình hóa tri thức được tạo ra trong sử dụng và để sử dụng các tổ chức

toán học vào nghiên cứu toán học và dạy học. Sau đó thì mô hình đã tỏ ra đặc biệt phù

4 Chữ th trong ký hiệu θ th có nghĩa là lý thuyết (theorie), còn p trong θ p có nghĩa là thực hành (pratique).

đó được hợp pháp hóa trong xã hội. Mô hình được đề nghị như vậy xuất phát từ

32

hợp với việc nghiên cứu những hiệu quả do sự chuyển đổi tác động đến các tổ chức

toán học khi người ta muốn đưa chúng vào với tư cách là công cụ cho những lĩnh vực

ngoài toán học và ứng dụng nghề nghiệp.” (Castelat, 2012)

Mô hình do Castelat đề nghị sẽ rất phù hợp cho nghiên cứu của chúng tôi, vì

thể chế được chúng tôi xem xét là một thể chế sử dụng tri thức toán học, và việc sử

dụng như thế nào có thể sẽ được giải thích bởi những bởi những yếu tố công nghệ

ngoài toán học.

1.3.5. Tổ chức didactic: một công cụ phân tích thực hành DH của GV

1.3.5.1. Tổ chức didactic

Khi một OM cần dạy đã được xác định, vấn đề đặt ra là tổ chức việc DH như

thế nào. Ta đứng trước một kiểu nhiệm vụ DH, tức là giúp người học nghiên cứu

một OM xác định.

Một praxéologie mà kiểu nhiệm vụ cấu thành nên nó thuộc loại nghiên cứu

hay DH được gọi là tổ chức didactic (organisation didactique), kí hiệu là OD. Cụ

thể hơn, một tổ chức didactic là một câu trả lời cho câu hỏi “dạy (tức là tổ chức

nghiên cứu) một tổ chức toán học xác định như thế nào?”

Như vậy, nghiên cứu một tổ chức didactic chính là nghiên cứu cách thức mà

người ta tiến hành để truyền bá một tổ chức toán học trong lớp học.

Theo Chevallard, dù không phải là mọi tổ chức toán học đều được tổ chức tìm

hiểu theo một cách thức duy nhất, thì vẫn có những thời điểm mà tất cả các hoạt

động nghiên cứu đều phải trải qua. Ông cho rằng, một tình huống học tập nói chung

bao gồm 6 thời điểm.

• Thời điểm thứ nhất: là thời điểm gặp gỡ lần đầu tiên với tổ chức toán học

OM – được xác định là mục tiêu đặt ra cho việc học tập liên quan đến đối tượng O.

Sự gặp gỡ như vậy có thể xẩy ra theo nhiều cách khác nhau. Tuy nhiên, có

một cách gặp, hay “gặp lại”, hầu như không thể tránh khỏi, trừ khi người ta nghiên

cứu O rất hời hợt, là cách gặp thông qua một hay nhiều kiểu nhiệm vụ Ti cấu thành

nên O. Sự “gặp gỡ lần đầu tiên” với kiểu nhiệm vụ Ti có thể xẩy ra qua nhiều lần,

tùy vào môi trường toán học và môi trường sư phạm tạo ra sự gặp gỡ này: người ta

33

có thể khám phá lại một kiểu nhiệm vụ giống như khám phá lại một người mà

người ta nghĩ rằng mình đã biết rõ.

• Thời điểm thứ hai: là thời điểm nghiên cứu kiểu nhiệm vụ Ti được đặt ra, và

xây dựng nên một kỹ thuật τi cho phép giải quyết kiểu nhiệm vụ đó.

Vấn đề xây dựng kỹ thuật luôn luôn là trung tâm của hoạt động toán học.

Trong thực tế, việc tìm cách giải quyết một bài toán luôn luôn đi cùng với việc xây

dựng nên ít nhất một mầm mống để từ đó một kỹ thuật được hình thành.

Khi nghiên cứu người ta có thể đi theo nhiều con đường khác nhau, có thể gặp

phải những chướng ngại, có thể phải thay đổi quyết định, … Quá trình nghiên cứu

đó khơi thông ra một kỹ thuật ưu việt, sẽ được giữ lại để giải những bài toán

cùng loại.

Như thế, nghiên cứu một bài toán cá biệt, làm mẫu cho kiểu nhiệm vụ cần

nghiên cứu, là một cách thức tiến hành để triển khai việc xây dựng kỹ thuật tương

ứng. Kỹ thuật này sau đó sẽ lại là phương tiện để giải quyết mọi bài toán cùng kiểu.

• Thời điểm thứ ba: là thời điểm xây dựng môi trường công nghệ- lý thuyết

[θ, Θ] liên quan đến τi, nghĩa là tạo ra những yếu tố cho phép giải thích kỹ thuật đã

được thiết lập.

Thời điểm này có mối quan hệ chặt chẽ với các thời điểm khác. Lần gặp gỡ

đầu tiên với một kiểu nhiệm vụ thường được đặt trong mối liên hệ với môi trường

công nghệ - lý thuyết đã xây dựng từ trước, hay trong mối liên hệ với những mầm

mống của môi trường cần phải tạo ra – môi trường ấy sẽ được xác định rõ trong mối

quan hệ biện chứng với sự xuất hiện của kỹ thuật.

Tuy nhiên, vì lý do “tiết kiệm” trong tổng thể, thời điểm thứ ba này theo

truyền thống lại thường được thực hiện ngay từ giai đoạn đầu tiên của quá trình

nghiên cứu. Giai đoạn ấy được xem là chung cho việc nghiên cứu nhiều kiểu nhiệm

vụ Ti. Tất cả những kiểu nhiệm vụ này dường như có cùng một môi trường công

nghệ - lý thuyết. Theo một cách thức cổ điển, các kiểu vấn đề xuất hiện ở đây như là

một dãy ứng dụng của khối công nghệ - lý thuyết đã được hình thành như vậy.

• Thời điểm thứ tư: là thời điểm làm việc với kỹ thuật.

34

Thời điểm này là thời điểm hoàn thiện kỹ thuật bằng cách làm cho nó trở nên

hiệu quả nhất, có khả năng vận hành tốt nhất - điều này nói chung thường đòi hỏi

chỉnh sửa lại công nghệ đã được xây dựng cho đến lúc đó. Đồng thời đây cũng là

thời điểm làm tăng khả năng làm chủ kỹ thuật của người học: thời điểm thử thách

kỹ thuật này đòi hỏi phải xét một tập hợp thích đáng cả về số lượng lẫn chất lượng

các nhiệm vụ.

• Thời điểm thứ năm: là thời điểm thể chế hóa.

Mục đích của thời điểm này là chỉ ra một cách rõ ràng những yếu tố của tổ

chức toán học cần xây dựng. Những yếu tố này có thể là kiểu bài toán liên quan, kỹ

thuật được giữ lại để giải, cơ sở công nghệ-lý thuyết của kỹ thuật đó, cách ghi hay

ký hiệu mới. Đặc biệt, phải phân biệt những yếu tố đã tham gia vào quá trình xây

dựng này với những yếu tố thực sự của tổ chức toán học nhắm đến (sự phân biệt mà

HS tìm cách làm rõ khi hỏi thầy giáo là có cần thiết “phải biết” hay không một kết

quả hay một quy trình nào đó).

• Thời điểm thứ sáu: là thời điểm đánh giá.

Thời điểm đánh giá nối khớp với thời điểm thể chế hóa. Trong thực tế, việc

DH phải đi đến một thời điểm mà ở đó người ta phải “điểm lại tình hình”: cái gì có

giá trị, cái gì đã học được, …

Lưu ý rằng cách đặt tên thời điểm thứ nhất, thứ hai, … không có nghĩa là việc

dạy một tổ chức toán học phải thực hiện theo đúng thứ tự này. Hơn nữa, một thời

điểm có thể được thực hiện nhiều lần trong DH.

1.3.5.2. Phân tích thực hành DH của GV

Theo Chevallard, khi phân tích thực hành của GV, nhà nghiên cứu cần phải trả

lời hai câu hỏi:

- Những tổ chức toán học nào được xây dựng trong lớp học ?

- Trong lớp học, GV đã tổ chức việc nghiên cứu các tổ chức toán học ấy như

thế nào ?

Khái niệm thời điểm nghiên cứu mà Chevallard đưa ra chính là để giúp nhà

nghiên cứu trả lời hai câu hỏi này.

35

Đối với nhà nghiên cứu, mô hình các thời điểm nghiên cứu có hai kiểu sử dụng quan

trọng. Trước hết, nó tạo nên một lưới để phân tích các quá trình sư phạm. Sau đó, nó

cho phép đặt ra một cách rõ ràng vấn đề thực hiện những thời điểm nghiên cứu khác

nhau. Chẳng hạn, làm sao để thực hiện một cách cụ thể thời điểm gặp gỡ đầu tiên với

một tổ chức toán học nào đó ? với kiểu nhiệm vụ nào ? dẫn dắt như thế nào việc

nghiên cứu một kiểu nhiệm vụ xác định ? làm thế nào để thực hiện tốt đẹp việc thể chế

hóa ? thực hiện thời điểm đánh giá ra sao ? ... (C. Comiti và Lê Thị Hoài Châu, 2011)

Tóm lại, khái niệm tổ chức didactic với các thời điểm của nó là một công cụ

giúp nhà nghiên cứu mô tả và phân tích cách thức mà GV đã triển khai để truyền bá

một tổ chức toán học cụ thể trong một lớp học cụ thể.

1.4. HỢP ĐỒNG DH

Hợp đồng DH (contrat didactique) là một khái niệm của Lý thuyết tình huống,

được Brousseau đưa vào với mục đích mô hình hóa các quyền lợi và nghĩa vụ ngầm

ẩn của GV cũng như của HS đối với một đối tượng tri thức đem ra giảng dạy. Cụ

thể hơn, đó là “tập hợp các quy tắc xác định, thường là ngầm ẩn, có thể phân nhỏ

một cách rõ ràng thành những điều khoản mà mỗi bên (thầy giáo và HS) có trách

nhiệm thực hiện nghĩa vụ của bên này đối với bên kia”

Cần phải nhấn mạnh rằng đó là những quy tắc đặc thù cho tri thức giảng dạy

chứ không phải là những quy tắc chung chung như kiểu “giờ học toán thì phải mang

theo đầy đủ sách giáo khoa, vở ghi, máy tính, thước kẻ”, “phải ghi vào vở những gì

GV viết bằng phấn màu hoặc đóng khung trên bảng”, hay “GV hỏi thì HS phải trả

lời”, v.v. … Những ví dụ vừa nêu được gọi là các quy tắc của hợp đồng sư phạm

(contrat pédagogique).

Các quy tắc của hợp đồng DH được hình thành như thế nào? Ta có thể tìm

… HS hiểu tình huống được giới thiệu, những câu được hỏi đặt ra, những thông tin

được cung cấp, những ràng buộc phải tuân theo, thông qua những gì giáo viên thực

hiện lặp đi lặp lại - có ý thức hay không trong thực tiễn giảng dạy của mình.

(Brousseau G., 1980)

thấy câu trả lời đầu tiên trong phát biểu sau:

Vậy thì cái gì cho phép GV thực hiện những hoạt động này ?

36

Với tư cách là một thành phần chủ chốt của thể chế DH I, cách mà GV nghĩ về

O, sử dụng O đương nhiên chịu sự chi phối của I. Chẳng hạn, đối với kiểu nhiệm vụ

T, nếu như một kĩ thuật τ nào đó đã được I ưu tiên, việc sử dụng τ thành thạo được I

xem là một kĩ năng cần đạt ở HS, thì không có lí do gì để GV không tập trung vào τ

trong DH. Những quy tắc ngầm ẩn quy định cái GV được phép làm và cần phải làm

được hình thành từ R(I, O). Như vậy, nghiên cứu quan hệ thể chế R(I, O) thông qua

việc phân tích các tổ chức toán học được trình bày, những bài tập được giải hoặc ưu

tiên giảng dạy trong sách giáo khoa sẽ cho phép ta dự đoán về sự tồn tại của những

quy tắc nào đó của hợp đồng DH. Hiển nhiên, đây chỉ là một trong những nhân tố

ảnh hưởng. Vì mỗi cá nhân X đều hoạt động trong nhiều thể chế nên quan hệ

R(X, O) có thể chịu ảnh hưởng của nhiều thể chế khác nhau.

Ví dụ: Xét O là khái niệm XS của một biến cố, I là thể chế DH theo chương

trình và sách giáo khoa thí điểm ban cơ bản (giai đoạn 2003-2006). Phân tích các

hoạt động, bài tập hiện diện trong Sách giáo khoa Đại số và Giải tích lớp 11, phân

tích những lời giải bài tập được đề nghị trong cuốn Sách bài tập tương ứng với sách

giáo khoa này, tác giả Vũ Như Thư Hương (2005) thấy: liên quan đến kiểu nhiệm

vụ tính XS của một biến cố (sơ cấp), chỉ có kỹ thuật áp dụng công thức Laplace

được sử dụng, và trong lời giải cũng không có bước kiểm tra điều kiện áp dụng

công thức (không gian các biến cố sơ cấp là hữu hạn, các biến cố đồng khả năng

xẩy ra). Hiện tượng đó cho phép tác giả đưa ra giả thuyết về sự tồn tại của hợp đồng

DH sau trong thực tế DH: HS luôn dùng định nghĩa cổ điển để tính XS và khi dùng

nó thì không có trách nhiệm phải kiểm tra tính đồng khả năng của các biến cố. Về

phía GV, phân tích trên cũng có thể dẫn ta đến với giả thuyết rằng GV sẽ chỉ ra cho

HS những bài tập thuộc phạm vi hợp thức của định nghĩa cổ điển và cũng không

yêu cầu HS kiểm tra điều kiện áp dụng định nghĩa.

Làm thế nào để xác định hiệu lực của hợp đồng DH

Một phương pháp nghiên cứu hiệu lực của hợp đồng DH là tạo ra sự biến loạn

trong hệ thống giảng dạy, sao cho có thể đặt các thành viên chủ chốt (GV, HS)

trong một tình huống khác lạ - được gọi là tình huống phá vỡ hợp đồng.

37

Để tạo ra những tình huống phá vỡ hợp đồng, người ta có thể tiến hành các

cách sau:

- Thay đổi điều kiện sử dụng tri thức;

- Đặt HS ra ngoài phạm vi của tri thức đang bàn đến hoặc những tình huống mà tri

thức đó không giải quyết được;

- Đặt GV trước những ứng xử của HS không phù hợp với những điều mà GV mong

đợi. Chẳng hạn đó là những câu trả lời khác lạ cho một tình huống.

Thiết kế những tình huống như vậy và quan sát ứng xử của HS, GV, phân tích

sản phẩm (lời, viết) mà họ tạo ra là cách để nhìn thấy hiệu lực của hợp đồng. Việc

các quy tắc hợp đồng vẫn chi phối ứng xử của họ chứng tỏ sự tồn tại của nó. Hoạt

động thiết kế và phân tích này của nhà nghiên cứu được gọi là hoạt động

“thực nghiệm”.

1.5. SAI LẦM VÀ HỢP ĐỒNG DH

Cách nhìn nhận về sai lầm của HS không giống nhau trong những lý thuyết

học tập khác nhau.

Thuyết hành vi cho sai lầm là một hiện tượng có hại đối với việc lĩnh hội kiến

thức và do đó cần tránh. Nói về nguyên nhân của sai lầm thì thuyết hành vi thường

đổ lỗi cho HS hay GV: do HS bất cẩn, không nắm vững kiến thức đã học, kĩ năng

yếu và khả năng suy luận kém, hay do GV trình bày không chính xác, dạy quá

nhanh hay giải thích không đủ rõ ràng,…

Khác với thuyết hành vi, thuyết kiến tạo có một cái nhìn tích cực về sai lầm:

sai lầm thực sự đóng một vai trò quan trọng và cần thiết cho học tập, nhất là khi nó

là hậu quả của những chướng ngại hình thành từ kiến thức cũ. Do đó, vấn đề không

phải là phòng tránh sai lầm, mà là chủ động tổ chức cho HS gặp sai lầm và sửa chữa

nó. Hơn nữa, thuyết kiến tạo đặc biệt nhấn mạnh vai trò chủ động của chủ thể

(người học) trong việc sửa chữa sai lầm.

“Sai lầm không phải chỉ là hậu quả của sự không biết, không chắc chắn, ngẫu nhiên

của những người theo chủ nghĩa kinh nghiệm và chủ nghĩa hành vi, mà còn có thể là

hậu quả của những kiến thức đã có từ trước, những kiến thức đã từng có ích đối với

Didactic Toán có cùng quan điểm với thuyết kiến tạo, như Brousseau đã khẳng định:

38

việc học tập trước kia, nhưng lại là sai, hoặc đơn giản là không còn phù hợp nữa đối

với việc lĩnh hội kiến thức mới. Những sai lầm kiểu này không phải là không dự kiến

trước được, và chúng tạo nên chướng ngại. Trong hoạt động của thầy giáo cũng như

trong hoạt động của học sinh, sai lầm có thể sinh ra từ nghĩa của kiến thức được thu

nhận bởi những chủ thể này.”(Brousseau G., 1983, tr.171)

Nhưng các nhà nghiên cứu Didactic Toán tìm hiểu sâu hơn nguồn gốc của sai

lầm. Họ phân biệt ba nguồn gốc cơ bản, theo đó sai lầm của HS có thể sinh ra từ:

- hạn chế của sự phát triển cá thể,

- những chướng ngại tri thức luận

sự chuyển hóa sư phạm: sự chuyển hóa sư phạm có thể tạo nên những quy -

tắc hành động (tham khảo Bessot A. và tgk, 2009) hay những quy tắc của

hợp đồng DH.

Trong luận án, chúng tôi đặc biệt quan tâm đến loại sai lầm có nguồn gốc từ

hợp đồng DH và chuyển đổi sư phạm được hình thành ngầm ẩn từ sách giáo khoa

hay từ hoạt động giảng dạy của GV.

1.6. ĐỒ ÁN DH

1.6.1. Khái niệm đồ án DH

Thuật ngữ đồ án DH được chuyển ngữ từ gốc tiếng Pháp ingénierie

didactique. Khái niệm này đã xuất hiện từ những năm đầu của thập kỷ 1980. Bản

thân từ ingénierie đã nói lên công việc của một kỹ sư. Cụ thể, Michèle Artigue

[…] thuật ngữ ingénierie nói về một kiểu công việc trong nghiên cứu didactic. Công

việc này có thể so sánh với công việc của người kỹ sư. Để thực hiện một dự án xác

định, người kỹ sư dựa trên những kiến thức khoa học thuộc lĩnh vực chuyên môn của

mình, chấp nhận tuân theo một sự kiểm tra về mặt khoa học, nhưng đồng thời anh ta

cũng ở trong tình thế buộc phải làm việc với những đối tượng phức tạp hơn nhiều so

với những đối tượng đã được làm rõ của khoa học. Điều này khiến người kỹ sư hầu

như phải tìm cách giải quyết, với tất cả các phương tiện mà con người sẵn có, những

vấn đề mà khoa học không muốn hoặc chưa thể nhận trách nhiệm giải quyết.

(1988) viết:

39

Như vậy, đồ án DH là một (hay một chuỗi) tình huống DH mà nhà nghiên cứu

đã xây dựng, trên cơ sở các kiến thức của một lĩnh vực khoa học, nhằm làm cho

người học làm việc trên những đối tượng phức tạp, trong một mục đích DH nào đó.

1.6.2. Chức năng kép của đồ án DH

Đồ án DH cho phép:

- vận hành trong hệ thống giảng dạy những hoạt động DH được xây dựng từ các

công trình nghiên cứu của Didactic Toán và các kết quả thu được từ trước.

- kiểm chứng các sản phẩm lý thuyết do nhà nghiên cứu thực hiện và triển khai

trong một hệ thống giảng dạy.

1.6.3. Các pha khác nhau của việc nghiên cứu một đồ án DH

1.6.3.1. Pha nghiên cứu tri thức

Để xây dựng một đồ án DH trước hết người ta phải tìm hiểu những kết quả

nghiên cứu liên quan đến tri thức nhắm đến trong đồ án, tiến hành các phân tích ban

đầu về:

- Đặc trưng tri thức luận của tri thức đó

- Phân tích kiến thức (quan niệm) của HS cũng như những khó khăn, chướng

ngại gặp phải trong việc học;

- Phân tích quan hệ thể chế (thực hiện qua việc nghiên cứu ít nhất là chương

trình và sách giáo khoa được sử dụng trong DH).

Những phân tích này không thể thiếu, vì đồ án DH phải nhắm đến một sự thỏa

mãn tốt hơn các đặc trưng tri thức luận và phù hợp hơn với đặc điểm tâm sinh lý

của HS. Trong phần 1.7 chúng tôi sẽ trình bày đầy đủ lợi ích của các phân tích này.

1.6.3.2. Pha xây dựng đồ án

Ở pha này nhà nghiên cứu xác định vấn đề sẽ được đưa ra cho người học

nghiên cứu, dàn dựng kịch bản, phân tích tiên nghiệm đồ án đã xây dựng, dự kiến

những kiểu DL cần thu thập. Pha này phải tính đến những phân tích đã được thực

hiện ở pha trước và lựa chọn giá trị của các biến didactic sao cho cái nhà nghiên

cứu muốn xuất hiện sẽ phải xuất hiện khi triển khai đồ án trong thực tế. Phân tích

40

tiên nghiệm về đồ án được xây dựng là cần thiết. Nó cho phép dự kiến những cái có

thể quan sát khi thực hiện đồ án DH.

Khái niệm phân tích tiên nghiệm đã được trình bày ở trên. Chúng tôi sẽ giải

thích rõ hơn khái niệm biến didactique (variable didactique).

Biến didactic

Một biến didactic là một tham số, có thể nhận nhiều giá trị. Sự thay đổi giá trị

của biến didactic sẽ dẫn đến sự thay đổi thứ tự của các chiến lược giải của HS. Như

vậy, thông qua sự lựa chọn giá trị của biến didactic, nhà nghiên cứu có thể “tạo ra

những thích nghi và những điều chỉnh mong muốn, tức là tạo ra việc học tập”

(Brousseau, 1982b). Cụ thể hơn, giá trị của biến phải được chọn sao cho chiến lược

cũ trở nên “đắt giá”, quá tốn kém, quá phức tạp hoặc thậm chí dẫn đến sai lầm.

Để minh họa, chúng tôi lấy giới thiệu vắn tắt tình huống phóng to hình đã

được Brousseau N. và Brousseau G. (1987) thiết lập để dạy số hữu tỉ. Tình huống

được xây dựng bao gồm việc giải quyết vấn đề sau: HS làm việc theo nhóm, mỗi

nhóm được phát một miếng bìa hình chữ nhật có kích thước là 20cm × 15cm trên đó

có hình vẽ gồm 6 mảnh ghép (Hình 1.1) và một số tờ giấy kẻ ô vuông. Mỗi HS có

một thước dài 20cm.

Hình 1.1. Các mảnh ghép trên miếng bìa hình chữ nhật

Nhiệm vụ của nhóm là tạo ra những hình tương tự lớn hơn so với hình mẫu đã

cho và tuân thủ quy tắc: đoạn thẳng dài 4cm trên hình mẫu thì phải có độ dài 7cm

trên bản sao. Nguyên tắc làm việc là: mỗi HS phải phóng to một hay hai mẩu. Khi

mỗi HS đã làm xong, các em ghép lại với nhau sao cho có được một hình giống với

hình mẫu.

41

Phân tích tiên nghiệm cho thấy có hai chiến lược không dẫn đến thành công:

Chiến lược 1: thêm 3 vào số đo các cạnh của “các góc vuông”; Chiến lược 2: nhân

mỗi số đo với 2 rồi bớt đi 1. Hai chiến lược này dựa vào những kiến thức liên quan

đến số tự nhiên và hình phóng to: Để phóng to, người ta thêm hoặc nhân với một số

nguyên. Nghĩa của phép nhân với một số nguyên là phép cộng lặp lại. Hơn nữa, nếu

ta thêm một số nguyên dương vào một số (và cũng vậy nếu nhân một số nguyên

dương với một số), ta sẽ có một số nguyên lớn hơn. Nghĩa của phép nhân với một

số hữu tỷ cần được xây dựng thì chống lại cái nghĩa đầu tiên ấy. Nhà nghiên cứu

muốn tạo ra một môi trường (vật chất) có tác động phản hồi khiến HS phải loại bỏ

=

+

hai chiến lược này. Muốn thế, nhà nghiên cứu chọn biến là cặp (n,p), với n và p là

p

kn

p =

kn

n 2

hai số xác định tỷ lệ phóng to. Những giá trị có thể chọn là: ,

p n

(k nguyên, n chẵn), là số hữu tỷ không thập phân. Chẳng hạn, các cặp số nguyên

(4,8), (4,6), (4,7), (3,7) minh họa cho các loại giá trị trên. Việc phóng to từ 4 sang 8

làm người ta nghĩ tới phép nhân với 2, cũng có nghĩa là 4 + 4. HS vẫn ở trong

khuôn khổ mô hình cộng và phạm vi các số nguyên. Việc phóng to từ 4 sang 6 được

coi như “x cộng thêm nửa x”. Ta sẽ có một mô hình trung gian giữa mô hình cộng

và mô hình tuyến tính, “gần” với mô hình cộng hơn vì trong trường hợp này, một

nửa cũng là một số nguyên. Việc phóng to từ 4 sang 7 không còn là chuyển đổi bình

thường nữa, nhưng vẫn có khả năng chia cho 2 (sự phóng to này có thể được xem

như “2 lần x trừ đi một nửa của một nửa của x”). Có một bước nhảy khi “chuyển từ

3 qua 7”, vì không tìm được hệ thức nào giữa chúng. HS bắt buộc phải từ bỏ mô

hình cộng và phạm vi các số nguyên. Như vậy, giá trị chọn phù hợp của biến sẽ làm

nảy sinh nghĩa của phép nhân với một số hữu tỷ, cho phép chuyển từ phép nhân với

một số nguyên (mô hình cộng, phép cộng lặp lại) sang phép nhân với một số hữu tỷ

(mô hình nhân, ảnh của ánh xạ tuyến tính).

42

Biến didactic và hợp đồng DH

Biến didactic liên quan đến tri thức toán học và nhà nghiên cứu hoàn toàn có

thể thay đổi các giá trị của các biến này trong bất kỳ giai đoạn nào của thực nghiệm

thông qua việc thay đổi các yếu tố toán học của bài toán. Việc chọn thời điểm thay

đổi giá trị của biến didactic trong một kiểu nhiệm vụ phụ thuộc vào mục đích và

điều kiện nghiên cứu (quỹ thời gian, phương pháp xử lý DL, …).

Trong trường hợp muốn nghiên cứu ảnh hưởng của các quy tắc của hợp đồng

DH, nhà nghiên cứu có thể lựa chọn giá trị của biến didactic sao cho HS được đặt

vào một tình huống không quen thuộc gọi là tình huống phá vỡ hợp đồng (các giá

trị “quen thuộc” của biến didactic trong một kiểu nhiệm vụ cụ thể thường gắn liền

với một hoặc nhiều quy tắc của hợp đồng DH).

Trước cùng một kiểu nhiệm vụ, với các giá trị thay đổi của biến didactic qua

từng pha của thực nghiệm, nhà nghiên cứu sẽ cần nhiều thời gian hơn, phải phân

tích DL nhiều hơn nhưng có thể quan sát được những ứng xử khác nhau của HS.

Nhà nghiên cứu cũng có thể khảo sát sự thay đổi của chiến lược theo sự thay đổi các

quy tắc của hợp đồng thông qua việc thay đổi giá trị biến didactic. Từ đó, có thể rút

ra vai trò của từng nhóm giá trị biến, vốn bị che giấu bởi hợp đồng.

Ngược lại, nếu cho biến didactic nhận một giá trị “không quen thuộc” (so với

quan hệ thể chế) ngay từ đầu thực nghiệm, nhà nghiên cứu có thể tiết kiệm thời gian

thực nghiệm, công sức phân tích và chứng minh được sự tồn tại của hợp đồng DH.

1.6.3.3. Pha thực nghiệm: triển khai đồ án trong thực tế và tổ chức quan sát

trên lớp học.

Tùy vào mục đích đặt ra mà nhà nghiên cứu tổ chức việc quan sát và thu thập

DL. Phân tích hậu nghiệm (những cái quan sát được) để xem có thể hợp thức hóa

(nội tại) hay không những gì đã dự kiến khi xây dựng đồ án.

1.7. PHÂN TÍCH TRI THỨC LUẬN TRONG DIDACTIC TOÁN

1.7.1. Về thuật ngữ phân tích tri thức luận

Khái niệm phân tích tri thức luận và lợi ích của nó trong Didactic Toán đã

được tác giả Lê Thị Hoài Châu làm rõ trong một công trình nghiên cứu khoa học

43

cấp bộ (mã số B2001.23.02), sau đó công bố trong Tạp chí Khoa học Đại học Sư

phạm Tp HCM số 32 (năm 2002), rồi trong Bessot A. và các tác giả (2009). Trong

phần dưới chúng tôi sẽ nêu những điểm cơ bản về khái niệm này.

Phân tích tri thức luận là khái niệm chuyển ngữ từ gốc từ analyse

épistémologique của tiếng Pháp. Trong ấn bản đầu tiên, tác giả Lê Thị Hoài Châu

(2002) chuyển ngữ sang tiếng Việt là phân tích khoa học luận. Nhiều công trình sau

đó sử dụng lại từ này. Tuy nhiên, trong ấn bản thứ hai (Bessot A. và tgk, 2009), tác

giả dịch là phân tích tri thức luận vì cho rằng từ này phản ánh chính xác hơn nội

Thuật ngữ tri thức luận (épistémologie) xuất hiện vào thế kỉ 19, được hình thành từ

hai từ gốc Hi Lạp épistème (khoa học) và logos (nghiên cứu về). Thuật ngữ này đã

được hiểu theo những nghĩa khác nhau. Trong Didactic Toán, người ta quan tâm đến

phân tích tri thức luận theo nghĩa nó “nghiên cứu những điều kiện sản sinh ra các kiến

thức khoa học, giúp cho ta hiểu rõ hơn mối liên hệ giữa việc tạo ra tri thức trong cộng

đồng các nhà bác học với việc dạy và học tri thức này” (Lê Thị Hoài Châu, 2002).

hàm của khái niệm analyse épistémologique.

Quan niệm rằng để thiết kế hay phân tích hoạt động DH một tri thức thì yếu tố

đầu tiên cần xem xét là chính tri thức đó, Didactic Toán đã xây dựng Thuyết nhân

học như một công cụ nghiên cứu đối tượng cần dạy. Nhưng, như chúng tôi sẽ chỉ ra

ở dưới, việc nghiên cứu quan hệ thể chế với đối tượng tri thức chưa đủ để hiểu về tri

thức đó, để nhìn thấy sự biến đổi mà tri thức phải chịu do ràng buộc của thể chế, để

trả lời nhiều câu hỏi khác liên quan đến việc DH nó. Khái niệm phân tích tri thức

Phân tích tri thức luận là nghiên cứu lịch sử hình thành tri thức, nhằm vạch rõ:

- nghĩa của tri thức, những bài toán, những vấn đề mà tri thức đó cho phép giải quyết;

- những trở ngại cho sự hình thành tri thức;

- những bước nhảy trong quan niệm, những điều kiện sản sinh ra tri thức;

- những quan niệm có thể gắn liền với tri thức.

Phân tích ấy sẽ giúp ta hiểu rõ mối liên hệ giữa quá trình xây dựng tri thức trong cộng đồng khoa học với việc dạy và học tri thức này. (Lê Thị Hoài Châu, 2002, tr. 4)

luận mang lại một công cụ bổ sung cho việc tìm hiểu tri thức.

1.7.2. Lợi ích của phân tích tri thức luận

1.7.2.1. Sự chuyển hóa sư phạm và lợi ích của phân tích tri thức luận

Sự chuyển hóa sư phạm biến một tri thức bác học thành một đối tượng có thể

44

dạy được cho một bộ phận xã hội xác định. Nhưng những biến đổi mà tri thức phải

chịu để trở thành đối tượng giảng dạy rất ít khi xuất phát từ lý do gắn liền với sự sản

sinh ra tri thức này. Chúng thường chỉ là giải pháp tình huống, chủ yếu là tuân theo

các ràng buộc nội tại của thể chế DH.

Tất nhiên, tri thức chương trình và sách giáo khoa đã được hình thành trên cơ

sở lấy tri thức bác học làm tham chiếu. Nhưng vẫn còn một số điểm tối trong mối

Trong khi trường học sống trong ảo tưởng rằng đối tượng dạy học là một bản copy,

tuy đã được đơn giản hoá nhưng vẫn trung thành, của đối tượng khoa học, thì phân

tích tri thức luận sẽ giúp nhà nghiên cứu hiểu rõ cái gì chi phối sự tiến triển của kiến

thức khoa học, đâu là sự chênh lệch giữa tri thức bác học với tri thức được dạy, đâu là

khoảng cách giữa hai hệ thống – toán học và dạy học.

Phân tích tri thức luận giúp ta vạch rõ các tham chiếu hợp thức của tri thức cần dạy,

trả lại cho tri thức những nghĩa rộng hơn, phong phú hơn, điều mà việc nghiên cứu

đơn thuần chương trình và sách giáo khoa không thể mang lại. Những hiểu biết khoa

học luận về tri thức cần dạy giúp nhà nghiên cứu và giáo viên nhìn nó ở một khoảng

cách cần thiết, […] không chỉ xem xét nó dưới lăng kính của chương trình và sách

giáo khoa. (Lê Thị Hoài Châu, 2002, tr.10)

liên hệ giữa tri thức bác học với tri thức được dạy.

1.7.2.2. Vấn đề thiết kế tình huống DH và lợi ích của phân tích tri thức luận

Các nghiên cứu hoạt động DH toán nói chung đều liên quan đến sự xây dựng

kiến thức ở chủ thể người học - HS. Nhà nghiên cứu phải đương đầu với vấn đề

thiết kế hay phân tích sự hình thành kiến thức khoa học trong một tình huống DH.

Vấn đề là phải “tái tạo” lại trong lớp học một sự hình thành nên những khái niệm

toán học với cái nghĩa mà ta muốn HS chiếm lĩnh. Nói cách khác, xây dựng một

tình huống trong đó tri thức cần dạy phải xuất hiện như một giải pháp tối ưu được

xem là mục đích của việc thiết kế một tình huống hay một đồ án DH. Khi thiết kế

hoặc phân tích một tình huống DH, trước hết nhà nghiên cứu phải tìm cách trả lời

những câu hỏi sau:

- Liệu có đảm bảo rằng vấn đề được đặt ra trong tình huống là đích thực đối

với tri thức hay không ? Từ đích thực ở đây được hiểu theo nghĩa tri thức cần dạy là

tri thức hoặc không thể thiếu, hoặc đem lại một chiến lược tối ưu cho việc giải

quyết vấn đề được đặt ra.

45

- Vấn đề đó có mối liên hệ như thế nào với lý do tồn tại của đối tượng tri thức

được xem là mục đích của hoạt động dạy-học ?

- Vấn đề ấy đưa lại cho tri thức cái nghĩa nào ?

Đó là những câu hỏi mang tính chất tri thức luận.

Dựa vào đâu để kiến tạo những tình huống như vậy, khi mà nghĩa của tri thức

và tình huống mang lại nghĩa đó đã bị che dấu qua quá trình chuyển hóa sư phạm

Phân tích tri thức luận lịch sử hình thành tri thức cho phép vạch rõ quá trình xây dựng

tri thức trong cộng đồng các nhà khoa học, sự phụ thuộc của nó vào các lĩnh vực toán

học có liên quan, từ đó xác định được nghĩa của tri thức, tình huống mang lại nghĩa

đó, điều kiện cho phép tri thức nảy sinh, hay ngược lại, cản trở sự tiến triển của nó,

những vấn đề gắn liền với tri thức, vị trí tương đối của nó trong một tri thức tổng quát

hơn, … Nó sẽ dẫn nhà nghiên cứu đến với câu trả lời cho một số câu hỏi tổng thể và

cơ bản sau, là cơ sở cho việc phân tích hay thiết kế các tình huống dạy-học: tri thức

được sinh ra nhằm giải quyết vấn đề gì ? Tri thức có thể tồn tại dưới những dạng thức

nào ? Chuyển từ dạng thức này sang dạng thức kia tương ứng với sự thay đổi nào

trong quan niệm ? (Lê Thị Hoài Châu, 2001, tr.9)

mà tri thức phải chịu ?

1.7.2.3. Các lợi ích khác của phân tích tri thức luận

Trong một sự học tập bằng thích nghi với tình huống, việc vượt qua những chướng ngại tri thức luận5 là điều không thể tránh khỏi, hơn thế, nó đóng vai trò

quyết định đối với quá trình xây dựng tri thức. Đồng thời, khi việc học xẩy ra bằng

thích nghi với tình huống thì có thể có những quan niệm tạm thời được hình thành,

phù hợp với một lớp tình huống này, nhưng lại không còn đúng trong tình huống

tổng quát. Vấn đề là phải biết chống lại những quan niệm cũ đã lỗi thời. Quan niệm

mới xuất hiện như là một giải pháp tối ưu cho tình huống mới.

Việc thiết kế những tình huống ấy đòi hỏi trước hết phải xác định được

chướng ngại cần vượt qua và quan niệm cần loại bỏ. Phân tích tri thức luận sẽ giúp

5 Về khái niệm chướng ngại, bạn đọc có thể tham khảo Bessot A. và tgk, 2009.

nhà nghiên cứu làm điều đó. Hiển nhiên, không phải mọi chướng ngại mà các nhà

46

toán học phải đương đầu trong lịch sử đều là chướng ngại của việc học tập ngày

nay, nhưng những chướng ngại học tập thường có thể tìm thấy dấu vết trong lịch sử.

1.8. VẤN ĐỀ MÔ HÌNH HÓA TRONG DH TOÁN

1.8.1. Về các thuật ngữ mô hình hóa, mô hình và mô hình toán học

Để vận dụng kiến thức toán học vào việc giải quyết những tình huống của thực

tế người ta phải toán học hóa tình huống đó, tức là xây dựng một mô hình toán học

thích hợp cho phép tìm một câu trả lời cho tình huống. Quá trình này gọi là quá

trình mô hình hóa toán học (mà trong luận án, để ngắn gọn, chúng tôi sẽ gọi tắt là

mô hình hóa).

Theo Từ điển bách khoa toàn thư, mô hình hóa toán học là sự giải thích toán

học cho một hệ thống ngoài toán học nhằm trả lời những câu hỏi mà người ta đặt ra

Mô hình hóa toán học là quá trình chuyển đổi một vấn đề thực tế sang một vấn đề toán

học bằng cách thiết lập các mô hình toán học và giải quyết vấn đề trong mô hình đó,

thể hiện và đánh giá lời giải trong ngữ cảnh thực tế, cải tiến mô hình nếu cách giải

quyết không thể chấp nhận.

trên hệ thống này. Một cách cụ thể hơn, Edwards và Hamson (2001) định nghĩa :

Trong phát biểu trên, cùng với mô hình hóa toán học tác giả đã sử dụng các

thuật ngữ mô hình, mô hình toán học. Dưới đây chúng tôi sẽ đưa ra một giải thích

ngắn gọn cho phép phân biệt ba thuật ngữ này.

Thuật ngữ mô hình được sử dụng ở nhiều khoa học, cả tự nhiên lẫn xã hội, với

những nghĩa khác nhau. Dưới đây là hai nghĩa phổ biến của nó.

Theo nghĩa thứ nhất, mô hình là vật có cùng hình dạng với vật ta cần nghiên

cứu, nhưng được thu nhỏ lại. Nó mô phỏng cấu tạo, thể hiện các đặc trưng của vật

mà ta cần xem xét. Ví dụ:

- Sử dụng các mô hình về hình chóp, hình lăng trụ trong DH khái niệm và tính chất

của các loại hình này.

- Mô hình máy bay dùng trong các nghiên cứu về cơ chế hoạt động của nó.

- Mô hình nhà ở kiểu mới trong một triển lãm.

47

Nghĩa này có thể được mở rộng cho các đối tượng trừu tượng, phi vật chất.

Chẳng hạn người ta nói: R² với hai phép toán cộng và nhân với số thực định nghĩa

+

=

+

+

(

)

(

)

(x

, x

(

,

)

như sau:

x x , 1 2

y y , 1

2

1

y 1

2

y ) 2

a x x 1 2

ax= ( 1

, ax ) 2

; )

là một mô hình của khái niệm không gian vectơ n-chiều

Nghĩa thứ hai - cũng thường được dùng - của thuật ngữ này: mô hình là cái thu

được từ việc diễn đạt theo một ngôn ngữ nào đó các đặc trưng chủ yếu của một đối

tượng để nghiên cứu đối tượng ấy.

Luận án của chúng tôi sử dụng thuật ngữ mô hình với nghĩa thứ hai. Theo

nghĩa đó mô hình là “một biểu diễn cho các phần quan trọng của một hệ thống có

sẵn (hoặc sắp được xây dựng) với mục đích sắp xếp kiến thức về hệ thống đó dưới

một dạng có thể dùng được” (Eykhoff P., 1974)

Trong cách hiểu này, mô hình toán học là một mô hình biểu diễn (cho hệ

thống, vấn đề cần nghiên cứu) bằng ngôn ngữ toán học.

1.8.2. Quá trình mô hình hóa

Nhiều nghiên cứu về giáo dục toán đề cập đến quá trình mô hình hóa toán học.

Các tác giả đã đưa ra những sơ đồ khác nhau để nói về quá trình này. Tuy nhiên, dù

dùng sơ đồ nào thì họ đều đề cập đến 4 bước sau đây của quá trình mô hình hóa.

Bước 1: Xây dựng mô hình trung gian của vấn đề được đặt ra, tức là xác định

những yếu tố có ý nghĩa quan trọng nhất trong hệ thống (thực tiễn) và xác lập các

qui luật phải tuân theo khi nghiên cứu vấn đề. Mô hình trung gian này còn được gọi

là mô hình phỏng thực tiễn. Theo nghĩa thứ hai mà chúng tôi đã trình bày ở trên về

thuật ngữ mô hình thì mô hình phỏng thực tiễn biểu diễn (hệ thống, vấn đề cần

nghiên cứu) bằng ngôn ngữ của hệ thống, có thể kết hợp thêm với ngôn ngữ khác,

trong đó chỉ giữ lại những thông tin (về hệ thống, vấn đề cần giải quyết) được người

nghiên cứu cho là thỏa đáng, là cần thiết.

Bước 2: Xây dựng mô hình toán học cho vấn đề đang xét, tức là diễn tả lại

dưới dạng ngôn ngữ toán học cho mô hình trung gian. Lưu ý là ứng với vấn đề đang

48

xem xét có thể có nhiều mô hình toán học khác nhau, tùy theo chỗ các yếu tố nào

của hệ thống và mối liên hệ nào giữa chúng được xem là quan trọng.

Bước 3: Sử dụng các công cụ toán học để khảo sát và giải quyết bài toán hình

thành ở bước hai. Căn cứ vào mô hình (toán học) đã xây dựng cần phải chọn hoặc

xây dựng phương pháp giải cho phù hợp.

Bước 4: Phân tích và KĐ lại các kết quả thu được trong bước ba. Trong phần

này phải xác định mức độ phù hợp của mô hình và kết quả tính toán với vấn đề thực

tế hoặc áp dụng phương pháp phân tích chuyên gia.

Ở bước này có thể xảy ra một trong hai khả năng:

Khả năng 1: Mô hình và các kết quả tính toán phù hợp với thực tế.

Khi đó chỉ cần tổng kết lại cách đặt vấn đề, mô hình toán học đã xây dựng, các

thuật toán đã sử dụng, kết quả thu được.

Khả năng 2: Mô hình và kết quả không phù hợp với thực tế.

Lúc này phải tìm nguyên nhân. Có thể đặt ra những câu hỏi sau:

- Các kết quả tính ở bước thứ ba có đủ độ chính xác không ?

Để trả lời, người ta phải kiểm tra lại các thuật toán, các quy trình, các tính toán

đã sử dụng. Ở đây, người ta tạm chấp nhận rằng mô hình toán học (và cũng có

nghĩa là mô hình trung gian) xây dựng như vậy là thỏa đáng.

- Mô hình toán học xây dựng như thế đã thỏa đáng chưa ? Nếu chưa thì phải

xây dựng lại. Với loại câu hỏi này, ta tạm chấp nhận mô hình trung gian đã xây

dựng, nhưng phải xem xét lại mô hình toán học đã lựa chọn.

- Mô hình trung gian xây dựng có phản ánh được đầy đủ hiện tượng thực tế

không ? Nếu không thì cần phải rà soát lại bước 1 xem có yếu tố, qui luật nào bị bỏ

sót không.

- Các số liệu ban đầu (các thông số, hệ số) có phản ánh đúng thực tế không ?

Nếu không thì phải điều chỉnh lại một cách nghiêm túc và chính xác.

Hai câu hỏi cuối đặt ra cho mô hình trung gian đã được xây dựng.

Như thế, mô hình hóa toán học là quá trình cấu trúc lại vấn đề ngoài toán học

nhờ những khái niệm toán học được lựa chọn một cách phù hợp. Quá trình ấy được

49

thực hiện thông qua việc xây dựng mô hình phỏng thực tế bằng cách “cắt tỉa” – hay

ngược lại, bổ sung thông tin - để có thể gắn vấn đề ban đầu với các quy trình toán

học. Trong bước tìm kiếm mô hình phỏng thực tế này người ta thường phải thực

hiện những việc như đặt giả thuyết, tổng quát hóa, hình thức hóa,… Bài toán toán

học cuối cùng được xây dựng phải đại diện trung thực cho bối cảnh thực tế. Cùng

một vấn đề của thực tiễn có thể có nhiều mô hình toán học khác nhau.

Quá trình mô hình hóa có thể được tóm lược qua sơ đồ 1.4

HỆ THỐNG NGOÀI TOÁN HỌC Câu hỏi liên quan đến hệ thống

Câu trả lời cho câu hỏi ban đầu

Rút gọn hệ thống (giữ lại những thông tin thỏa đáng)

Mô hình trung gian

(duy trì mối liên hệ về ngữ nghĩa đối với hệ thống

mà ta tìm cách mô hình hóa)

Trình bày lại các câu hỏi

Giải bài toán

Câu trả lời cho bài toán toán học

MÔ HÌNH TOÁN HỌC

Sơ đồ 1.4. Quá trình mô hình hóa

1.9. KẾT LUẬN CHƯƠNG 1

Những công cụ lý thuyết trình bày trong Chương 1 không chỉ cho phép mô tả

các hoạt động DH mà còn có khả năng phân loại, giải thích các sự kiện đã và sẽ xảy

ra trong tình huống. Chúng mang lại cho chúng tôi những mô hình nghiên cứu phù

hợp với câu hỏi đã được đặt ra ở đầu luận án.

50

CHƯƠNG 2

XÁC SUẤT – THỐNG KÊ VÀ Y HỌC:

TỪ TOÁN HỌC ĐẾN NHỮNG NGHIÊN CỨU THỰC TIỄN ĐẦU TIÊN

Cơ thể con người là một thực thể sinh học luôn chịu sự tác động qua lại của

các yếu tố môi trường và vũ trụ xung quanh. Sức khỏe của một cá nhân, một cộng

đồng dân cư nằm trong mối liên hệ với các yếu tố tổng hợp của môi trường sinh

thái. Chính vì thế, các quá trình sinh lý và sinh hóa diễn ra trong cơ thể con người

cũng tuân theo một số quy luật toán học về mặt sinh học. (Đỗ Hàm, 2007)

Là một ngành khoa học thực nghiệm, mọi kết quả mang tính quy luật của Y –

Dược học đều phải được rút ra từ các nghiên cứu trên mẫu. Chính vì thế mà XS-TK

là công cụ lý thuyết không thể thiếu của khoa học này. Cũng vì lẽ đó, nghiên cứu

thực tiễn đầu tiên của chúng tôi sẽ được đặt trên hai hướng:

- Công cụ XS-TK được các nhà nghiên cứu y học của Việt Nam sử dụng ra sao ?

- Việc DH XS-TK trang bị công cụ này ra sao cho sinh viên đại học Y – Dược ?

Hướng thứ nhất nảy sinh từ ghi nhận về những khó khăn của nhiều học viên

cao học, nghiên cứu sinh và một số nhóm nghiên cứu của Đại học Y Dược Tp HCM

mà chúng tôi có cơ hội hợp tác: họ có nhiều lúng túng khi phân tích DL. Vì vậy,

theo hướng thứ nhất, chúng tôi sẽ chỉ ra một số sai lầm liên quan đến việc sử dụng

XS-TK, được tìm thấy trong các công trình nghiên cứu thuộc lĩnh vực Y – Dược.

Trước khi phân tích các sai lầm đó, chúng tôi sẽ bắt đầu bằng việc làm rõ những

ứng dụng cơ bản của XS-TK trong Y - Dược học, một thể chế sử dụng tri thức, theo

ngôn ngữ của Thuyết nhân học trong Didactic Toán. Kết quả nghiên cứu trên hướng

thứ nhất sẽ được trình bày trong hai phần đầu của chương.

Cũng chính ghi nhận thực về sự lúng túng của nhiều nhà nghiên cứu khi sử

dụng công cụ XS-TK đã khiến chúng tôi mong muốn thực hiện một tìm hiểu sơ bộ

về thực tế đào tạo ở trường Đại học Y Dược Tp HCM trong lĩnh vực XS - TK. Điều

này được thực hiện thông qua việc quan sát giờ dạy một nội dung thuộc chương

trình XS-TK của trường. Giống như trên, trước khi quan sát giờ dạy, chúng tôi sẽ

51

làm rõ ứng dụng của XS-TK trong chẩn đoán – điều trị. Nghiên cứu theo hướng thứ

hai này được trình bày trong hai phần cuối của chương.

2.1. NHỮNG ỨNG DỤNG CƠ BẢN CỦA XS-TK TRONG NGHIÊN CỨU Y HỌC

Việc sử dụng XS-TK trong nghiên cứu y học góp phần đánh giá những vấn đề

về bệnh tật của con người, xác định các yếu tố nguy cơ, mối quan hệ nhân quả,

Thống kê y sinh học là môn toán ứng dụng dùng để nghiên cứu và phân tích các vấn

đề và sự kiện liên quan đến y sinh học. Đó chính là sự toán học hóa các vấn đề sinh

học và sức khỏe con người, làm cho nó phổ biến và đặc trưng cũng như sự trừu tượng

hoặc cụ thể về nội dung và hình thức được nâng lên một bước rõ rệt và sâu sắc hơn để

cho sự hiểu biết cũng tiến dần đến bản chất. (Đỗ Hàm, 2007)

Trong y học, những khái niệm và nguyên tắc thống kê học cũng được ứng dụng trong

mọi hoạt động, từ chẩn đoán đến điều trị bệnh cho từng con người, từ điều tra dịch tễ,

chẩn đoán cộng đồng, đến thiết kế và lượng giá những chương trình can thiệp, nhằm

bảo vệ và nâng cao sức khỏe cộng đồng, đồng thời giúp ta có thể dự báo được những

diễn biến sắp tới. (Lê Trường Giang, 2007)

tương quan giữa môi trường sinh thái với sức khỏe cộng đồng.

Dưới đây chúng tôi sẽ cố gắng làm rõ vai trò của XS-TK thông qua những ứng

dụng cơ bản của nó trong các nghiên cứu của y học. Với mục đích này, việc phải

nhắc đến các công thức, các phương pháp của XS-TK là không tránh khỏi. Tuy

nhiên, do khuôn khổ có hạn và đặc biệt là do tính chất của luận án, chúng tôi không

đi sâu vào lĩnh vực XS-TK mà sẽ chỉ làm rõ “cái hồn” của nó trong các nghiên cứu

y học. Một phân tích bổ sung về những ứng dụng của nó sẽ được trình bày trong

Phụ lục 1 – Một số ứng dụng của XS-TK trong y học của luận án.

Để phát triển một loại thuốc mới, một phương pháp điều trị mới, nhà nghiên

cứu phải thực hiện và trải qua nhiều giai đoạn: tìm công thức hóa học, thử nghiệm

trên những động vật có đặc tính sinh học gần giống con người (thỏ, chuột, khỉ, …),

thử nghiệm trên người (tình nguyện viên), ghi nhận những thông số liên quan và

cuối cùng là chứng tỏ thuốc mới có hiệu quả điều trị bằng các phương pháp của TK.

Để thực hiện các phương pháp này, ba bài toán sau đây của TK cần được sử dụng:

chọn mẫu, ước lượng khoảng tin cậy và KĐ giả thuyết TK. Những ví dụ minh họa

52

trong phần dưới đều lấy từ thực tế – tìm thấy trong một số tài liệu nghiên cứu, tạp

chí khoa học về y học và các đề tài nghiên cứu đã được thực hiện.

2.1.1. Chọn mẫu

Chọn mẫu là công việc rất quan trọng của một công trình nghiên cứu. Nếu

mẫu chọn không đại diện được cho tổng thể thì nghiên cứu trên mẫu không cho

phép đưa ra những dự đoán thỏa đáng cho tổng thể.

Trong chọn mẫu, xác định cỡ mẫu là một trong những việc cần thực hiện đầu

tiên. Cỡ mẫu nhỏ thì mẫu sẽ không phản ánh đầy đủ thông tin của quần thể nghiên

cứu, dẫn đến những kết luận không đáng tin cậy. Ngược lại, cỡ mẫu lớn sẽ làm hao

tốn tài nguyên, kinh phí, thậm chí làm hư hại quần thể, vi phạm y đức. Đối với mỗi

bài toán TK, cách chọn mẫu cũng khác nhau tùy theo mục đích nghiên cứu và tính

chất của biến ngẫu nhiên. Việc tính cỡ mẫu phải dựa vào những thông tin đã biết về

quần thể (qua các công trình đã thực hiện) hoặc phải tiến hành nghiên cứu mô

phỏng để thu thập các thông tin cần thiết.

Chúng ta biết rằng chọn mẫu là một bài toán cơ bản của lý thuyết TK và lý

thuyết này cung cấp cho ta các công thức xác định cỡ mẫu tùy theo tình huống, mục

đích nghiên cứu.

2.1.2. Ước lượng khoảng tin cậy và kiểm định giả thuyết thống kê

Để đưa ra những kết luận cho tổng thể từ những kết quả thu được qua phân

tích các đặc trưng của mẫu thì các nghiên cứu trong y học không thể nào không đối

diện với bài toán ước lượng và KĐ giả thuyết TK.

Cụ thể là sau khi xác định cỡ mẫu, thu thập DL, nhà nghiên cứu tính các thông

số TK liên quan đến mẫu vừa thu thập như trung bình, phương sai, độ lệch chuẩn,

sai số chuẩn, trung vị, yếu vị, nguy cơ tương đối (RR), tỷ số nguy cơ (OR), … Để

biết độ dao động của các thông số này trong dân số, nhà nghiên cứu cần tiến hành

ước lượng khoảng tin cậy với một độ tin cậy xác định – thường là 95% hoặc 99%.

Trong các nghiên cứu y học, nhiều khi một biến số không thể mô tả đầy đủ

một chỉ số lâm sàng nên người ta phải căn cứ vào nhiều biến số. Để biết độ dao

53

động hoặc so sánh các biến số này, cùng với phương pháp KĐ giả thuyết TK, ước

lượng khoảng tin cậy là một trong những khâu quan trọng của một nghiên cứu.

là biến cố viêm phổi do virus. Đo nồng độ CRP

Ví dụ 2.1: Để phân biệt viêm phổi do vi trùng hay do virus, người ta đo nồng độ CRP (C-Reactive Protein) (mg/l) trong máu và tìm điểm cắt để chẩn đoán. Gọi B+ biến cố viêm phổi do vi trùng và B-

trong 10 người ở mỗi nhóm ta có kết quả trong bảng 2.1:

Bảng 2.1. Nồng độ CRP

[Nguồn: Nguyễn Ngọc Rạng, 2012]

Nồng độ CRP của nhóm viêm phổi do vi trùng có cao hơn nồng độ CRP của

nhóm viêm phổi do virus không?

Để trả lời câu hỏi này, nhà nghiên cứu phải tiến hành KĐ giả thuyết TK. Cụ

H

:

;

H

0

= µ µ 2

1

:A

> µ µ 2

1

thể, ở đây có hai giả thuyết mà ta phải KĐ để bác bỏ một:

Nhiều kiến thức XS-TK cần thiết cho việc giải bài toán này, nhưng chúng tôi

sẽ không đi sâu phân tích ở đây.

2.1.3. Tương quan và hồi quy

Phương pháp phân tích tương quan và hồi quy cho phép xác định xem một yếu

tố nguy cơ nào đó có gây bệnh cho một cá nhân hoặc cộng đồng hay không. Trong

y học, những phương pháp phân tích hồi quy và tương quan như hồi quy đơn biến,

đa biến, hồi quy logistic,…thường được sử dụng.

Để khảo sát sự tương quan giữa hai biến số định tính, người ta thường sử dụng

phép kiểm chi bình phương, phép kiểm u hoặc phép kiểm chính xác Fisher.

Nếu cần khảo sát tương quan giữa một biến số định lượng và một biến số định

tính, chẳng hạn hàm lượng cholesterol và bệnh B, thì phép kiểm u hoặc phép kiểm t

là cần thiết.

54

Trường hợp cuối cùng là tương quan giữa 2 biến định lượng thì sử dụng

phương pháp hồi quy Pearson (Nguyễn Văn Tuấn, 2007). Để KĐ các giả thuyết TK

trong trường hợp này, các phép kiểm thường được sử dụng là phép kiểm t (nhằm

đánh giá 2 biến có thực sự tương quan không), phép kiểm u (trong bài toán so sánh

các hệ số tương quan), phép kiểm F (dùng để KĐ tính tương thích của phương trình

hồi quy), …

Như vậy trong mọi trường hợp, KĐ giả thuyết TK đều được sử dụng để khảo

sát sự tương quan giữa hai biến số, KĐ các giả thuyết liên quan đến mô hình hồi

quy - tương quan.

2.1.4. Các mô hình nghiên cứu trong y học

Ngoài ý tưởng mới, giá trị khoa học của một nghiên cứu y học thường được

đánh giá qua phương pháp, nhất là phương pháp thiết kế, thu thập và phân tích DL.

Theo Beth Dawson và Robert G.Trapp (2004), các nghiên cứu trong y học thực

chứng đều thuộc một trong ba mô hình: nghiên cứu mô tả, nghiên cứu phân tích,

nghiên cứu thực nghiệm.

2.1.4.1. Nghiên cứu mô tả

Mục đích của nghiên cứu mô tả nhằm xác định rõ bản chất của các sự vật và

hiện tượng. Để thực hiện điều này, nhà nghiên cứu cần phải thu thập và trình bày

DL một cách có hệ thống về tình hình bệnh tật hoặc một vấn đề sức khỏe cụ thể:

men gan ở bệnh nhân viêm gan, lượng HbA1c ở bệnh nhân đái tháo đường, chỉ số

lipid ở bệnh nhân tăng huyết áp, …

Các tri thức XS-TK thường được sử dụng trong nghiên cứu này là so sánh các

trung bình, các tỷ lệ hoặc phân tích tương quan giữa các biến số.

Ví dụ 2.2. Đề tài sau đây thuộc dạng nghiên cứu mô tả và phân tích: “Tương quan

giữa chỉ số khối cơ thể và rối loạn lipid máu ở bệnh nhân tăng huyết áp”

Mục tiêu nghiên cứu: xác định mối tương quan giữa chỉ số khối cơ thể và tình trạng

rối loạn lipid máu ở bệnh nhân tăng huyết áp.

Phương pháp nghiên cứu: nghiên cứu mô tả và phân tích.

Kết luận: Tương quan giữa BMI với rối loạn lipid máu ở bệnh nhân tăng huyết áp là ở

mức tương quan thấp. (Trần Thị Mỹ Loan và tgk, 2009)

55

Các phân tích TK được sử dụng:

- KĐ giả thuyết TK bằng phép kiểm t cho các biến số định lượng và phép kiểm chi

bình phương cho các biến số định tính.

- Tìm tương quan giữa các biến định lượng bằng phương pháp Pearson.

2.1.4.2. Nghiên cứu phân tích

Mục đích của phương pháp này là xác định các nguyên nhân hay các yếu tố

nguy cơ của của một bệnh nào đó bằng cách so sánh hai hay nhiều nhóm có đặc tính

X và không có đặc tính X.

Nghiên cứu này có thể chia thành 3 loại chính là nghiên cứu cắt ngang, nghiên

cứu cắt dọc (kể cả đoàn hệ) và nghiên cứu bệnh chứng.

a. Nghiên cứu cắt ngang (cross-sectional study)

Nghiên cứu này được tiến hành tại một thời điểm trong thời gian ngắn với mục

đích ước tính tỷ lệ bệnh lưu hành và các yếu tố liên quan đến bệnh trong một

quần thể.

Ví dụ 2.3. Đề tài “Nồng độ acid uric huyết thanh ở bệnh nhân tăng huyết áp”.

Mục tiêu nghiên cứu: Khảo sát nồng độ acid uric huyết thanh ở bệnh nhân tăng huyết

áp nguyên phát

Đối tượng: Tất cả bệnh nhân tăng huyết áp nguyên phát mới được chẩn đoán hoặc

không được điều trị hạ áp liên tục trước lúc nhập viện, vào khoa tim mạch bệnh viện

GĐ từ tháng 03 đến tháng 09/2007 (và không thuộc bảng tiêu chuẩn loại trừ).

Phương pháp nghiên cứu: mô tả cắt ngang, tiền cứu.

(Hồ Thị Ngọc Dung và tgk, 2009)

Dùng phép kiểm t để so sánh hai trung bình về nồng độ acid uric huyết thanh

của nam và nữ. Kết quả: có sự khác biệt có ý nghĩa TK về nồng độ acid uric huyết

thanh ở nam và nữ (p < 0,001), không có sự khác biệt giữa các lớp tuổi bằng phép

phân tích phương sai (p = 0,003)

b. Nghiên cứu cắt dọc (longtidinal study)

Nghiên cứu cắt dọc nhằm ước tính tỷ lệ phát sinh của bệnh và các yếu tố liên

quan đến bệnh trong một quần thể.

56

Ví dụ 2.4. Đề tài: “Tìm hiểu giá trị nồng độ NT – Pro ANP, MR – Pro AMD trong

chẩn đoán và tiên lượng trên bệnh nhân suy tim”. Tác giả sử dụng phương pháp mô

- Xác định nồng độ NT-proANP ở các giai đoạn A, B, C, D và điểm cắt trong chẩn đoán suy tim.

- Khảo sát mối tương quan giữa NT-proANP với các giai đoạn A, B, C, D

- Khảo sát tương quan giữa NT-proANP trong máu với tình trạng phì đại tâm thất, rung nhĩ

trên điện tâm đồ.

- Khảo sát tương quan giữa nồng độ NT-proANP trong máu với rối loạn chức năng tâm thu,

tâm trương.

- Khảo sát giá trị tiên đoán tử vong của NT-proANP, MR-proADM (Nguyễn Chí Thanh, 2011).

tả cắt dọc với các mục đích sau:

Để giải quyết các vấn đề đặt ra, các phân tích TK được sử dụng:

- Phân tích đường cong Kaplan Meier dự báo khả năng sống còn dựa theo NT – Pro

ANP, MR – Pro ADM

- Phân tích tương quan đa biến tìm xem yếu tố nào ảnh hưởng đến khả năng sống

còn mạnh nhất (EF, NYHA, NT – Pro ANP, MR – Pro ADM, tuổi).

c. Nghiên cứu bệnh - chứng (case control study)

Nghiên cứu này được dùng để tìm hiểu sự liên hệ giữa một yếu tố X và bệnh B

bằng cách so sánh hai trung bình hoặc hai tỷ lệ của nhóm có bệnh và nhóm không

bệnh (nhóm chứng)

Nghiên cứu bệnh - chứng thích hợp với các bệnh hiếm, vì cỡ mẫu nhỏ hơn

nhiều so với nghiên cứu cắt ngang hoặc cắt dọc.

Phương pháp TK được sử dụng trong nghiên cứu: sử dụng phép kiểm u và

phép kiểm t để so sánh hai trung bình, hai tỷ lệ.

Ví dụ 2.5. Một ví dụ về phương pháp nghiên cứu bệnh - chứng là đề tài nghiên cứu:

“Vai trò của C-reactive protein trong chẩn đoán viêm ruột thừa cấp”

Mục tiêu: Xác định vai trò của C-reactive protein (CRP) trong chẩn đoán viêm ruột

thừa (VRT) cấp, tìm ra ngưỡng chẩn đoán và giá trị chẩn đoán tương ứng, xem xét

tương quan giữa nồng độ CRP máu với tình trạng ruột thừa trong mổ cũng như giữa

các triệu chứng lâm sàng và các XN máu với chẩn đoán VRT.

Phương pháp nghiên cứu: nghiên cứu bệnh chứng bắt cặp

(Đặng Quốc Việt và tgk, 2010)

57

Ứng dụng các tri thức về XS-TK trong đề tài như sau:

- Tính XS có điều kiện: độ nhạy, độ chuyên, giá trị tiên đoán âm và giá trị tiên đoán

dương.

- Phương pháp KĐ giả thuyết TK được sử dụng để so sánh tổng số bạch cầu và bạch

cầu đơn nhân trung tính giữa nhóm viêm ruột thừa và nhóm chẩn đoán khác dẫn đến

kết luận số bạch cầu ở nhóm viêm ruột thừa tăng cao hơn trong nhóm chẩn đoán

khác; không có sự khác biệt về số bạch cầu giữa nhóm viêm ruột thừa có biến

chứng và chưa biến chứng.

- Bằng phương pháp hồi quy logistic đa biến, các tác giả đã xây dựng được phương

=

V

ln

trình hồi quy giữa các triệu chứng và VRT là:

  

  

VRT VRT

= -0,359 + 0,561A + 2,261B - 0,001C + 0,001D + 0,02E

Trong đó, các triệu chứng là A: chán ăn, B: phản ứng thành bụng, C: tổng số bạch

=

P VRT

(

)

cầu, D: số lượng bạch cầu đa nhân trung tính và E: CRP máu

V e +

V e

1

Từ đó tính được XS VRT của một bệnh nhân là và khẳng định

có sự tương quan thuận giữa CRP trong máu và mức độ viêm ruột thừa. Theo đó,

nếu một bệnh nhân viêm ruột thừa càng nặng thì CRP trong máu càng cao.

2.1.4.3. Nghiên cứu thực nghiệm

Có ba loại nghiên cứu thực nghiệm: Thử nghiệm lâm sàng đối chứng ngẫu

nhiên, thử nghiệm vaccine và thử nghiệm can thiệp.

a. Thử nghiệm lâm sàng đối chứng ngẫu nhiên (Randomized controlled clinical

trial) thường được sử dụng để đánh giá hiệu quả của một phương pháp điều trị, hiệu

quả của một loại thuốc mới. Các đối tượng nghiên cứu được chia thành 2 nhóm.

Nhóm I: nhóm thử nghiệm được can thiệp (sử dụng thuốc mới, hoặc phương pháp

điều trị mới). Nhóm II: nhóm đối chứng (điều trị giả hoặc dùng giả dược - placebo).

Sau đó hai nhóm được theo dõi cùng lúc để xem kết quả giữa hai nhóm có khác

nhau không.

Trong thử nghiệm này, các phương pháp thường được sử dụng là mù đôi

(bệnh nhân và nhà nghiên cứu đều không biết mình được phân vào nhóm nào), mù

58

đơn (chỉ nhà nghiên cứu biết, người tham gia không biết về chế độ điều trị), không

Thử nghiệm lâm sàng đầu tiên trong y học do bác sĩ người Pháp tên là Pierre Louis

được thực hiện vào năm 1836. Trong thử nghiệm này, ông điều trị một nhóm bệnh

nhân bị viêm phổi bằng cách trích nhiều máu và một nhóm bệnh nhân khác được trích

ít máu hơn. Sau đó ông đếm số lượng bệnh nhân chết trong hai nhóm và đưa ra kết

luận là trích nhiều máu là một phương pháp điều trị nguy hiểm.

(Nguyễn Văn Tuấn, 2004)

mù (không thể thực hiện các can thiệp ngoại khoa)

Ví dụ 2.6. Một nghiên cứu thử nghiệm lâm sàng đối chứng ngẫu nhiên “không mù”:

“So sánh Gatifloxacin với Azithromycin trong điều trị thương hàn không biến

chứng ở trẻ em và người lớn tại Việt Nam”

Các phân tích TK được sử dụng trong nghiên cứu này: KĐ chính xác Fisher,

95% khoảng tin cậy cho OR và RR, phân tích sống sót, phương pháp Kaplan-Meier,

Mục tiêu của nghiên cứu là xác định tính an toàn, hiệu quả, sẵn có và chấp nhận được

của các kháng sinh điều trị thương hàn đa kháng và kháng nalidixic acid.

Phân bố đối tượng ngẫu nhiên vào 2 nhóm:

- Nhóm 1: Azithromycin (ZITHROMAX, Pfizer) uống 20mg/kg-1 lần/ngày x 7 ngày.

- Nhóm 2: Gatifloxacin (TEQUIN, Bristol-Myer Squibb) 10mg/kg-1 lần/ngày x 7

ngày.

phép kiểm log-rank và mô hình Cox.

Kết luận: Cả 2 kháng sinh Gatifolxacin và Azithromycin đều có tính an toàn và hiệu

quả cao trong điều trị thương hàn, đặc biệt ở các vùng có bệnh thương hàn đa kháng

thuốc và kháng nalidixic acid cao. Giá thành điều trị 7 ngày của Gatifloxacin rẻ hơn và

bằng 1/3 so với giá thành điều trị của Azithromycin. (Nguyễn Ngọc Rạng, 2012)

b. Thử nghiệm vaccine (Betty R. Kirkwood, 2003)

Thử nghiệm này tương tự thử nghiệm lâm sàng thuốc và các phương pháp

điều trị, chỉ khác biệt ở mục tiêu thử nghiệm là đánh giá hiệu quả của vaccine trong

việc phòng ngừa sự xuất hiện của bệnh. Chủng vaccine là một biện pháp phòng

bệnh, vaccine và giả dược được dùng cho hai nhóm người khỏe mạnh, không phải

cho người bệnh. Nếu vaccine có hiệu lực thì tỷ lệ bệnh trong nhóm dùng giả dược

sẽ cao hơn so với nhóm dùng vaccine.

59

Ví dụ 2.7. Kết quả thử nghiệm vaccine cúm: Trong 460 người lớn có 240 người

được tiêm vaccine và 220 người được tiêm placebo. Trong tổng số 100 người bị

cúm có 20 người trong nhóm vaccine và 80 người ở nhóm placebo.

Câu hỏi đặt ra là: Có đủ chứng cứ để xem vaccine có hiệu quả hay sự khác biệt

là do tình cờ? (xem bảng 2.2)

Bảng 2.2. Kết quả thử nghiệm vaccine cúm

[Nguồn: Betty R. Kirkwood, 2003]

Để trả lời câu hỏi này, phương pháp TK được sử dụng là phép kiểm chi bình

phương dẫn đến kết luận: có sự khác biệt có ý nghĩa TK về hiệu lực phòng cúm

trong nhóm vaccine và nhóm placebo (p < 0,0001).

c. Nghiên cứu can thiệp

Trong nghiên cứu này, nhà nghiên cứu đã có một sự can thiệp trực tiếp vào

nhóm bệnh hoặc cả hai nhóm và so sánh kết quả quan sát trên hai nhóm.

Ví dụ 2.8. Đề tài “Hạ can-xi huyết trong kiềm hô hấp cấp” (Trần Văn Thạch, 2005)

Bằng phương pháp nghiên cứu can thiệp, các tác giả đã so sánh hiệu quả của

hai phương pháp điều trị bằng tái thở vào túi giấy và điều trị thay thế chích tĩnh

mạch can-xi. Bệnh nhân được chia làm hai nhóm: nhóm I được điều trị với chích

tĩnh mạch can-xi, nhóm II điều trị bằng thở vào bao giấy không dùng thuốc. Kết

quả: thời gian (phút) hết triệu chứng nhóm I là 3,8 ± 0,8 và nhóm II là 4,4 ± 1,17.

Để so sánh thời gian trung bình hết triệu chứng hạ can-xi huyết, tác giả sử

dụng phép kiểm t dẫn đến kết luận: Trung bình hai nhóm này khác nhau không có ý

nghĩa TK, tức là hiệu quả của hai phương pháp điều trị như nhau.

60

2.2. THỰC TIỄN SỬ DỤNG XS-TK: MỘT SỐ SAI LẦM TÌM THẤY

Phân tích trên của chúng tôi cho thấy trong mọi công trình nghiên cứu thuộc

lĩnh vực y học đều có sự can thiệp của XS-TK nói chung và KĐ giả thuyết TK

nói riêng.

Trở về với đề tài đào tạo cán bộ y tế của mình, chúng tôi tiến hành xem xét

một số công trình đã công bố để hiểu các tác giả đã sử dụng công cụ XS-TK ra sao.

Điều ngạc nhiên là chúng tôi tìm thấy một số sai lầm khá phổ biến về phương diện

XS-TK. Điều đó góp phần củng cố ghi nhận ban đầu khi chọn đề tài cho luận án:

khó khăn của các nhà nghiên cứu y học mà chúng tôi đã gặp không phải là cá biệt.

Để tìm hiểu về thực trạng sử dụng XS-TK và những sai sót trong các nghiên

cứu y học, chúng tôi đã thực hiện một điều tra dựa trên các đề tài nghiên cứu được

công bố trong thời gian gần đây.

2.2.1. Không đảm bảo nguyên tắc lấy mẫu

Sau khi tính toán cỡ mẫu cần thiết cho nghiên cứu, nhà nghiên cứu cần tiến

hành lấy mẫu. Một trong những nguyên tắc lấy mẫu là phải đảm bảo mẫu được lấy

mang tính đại diện cho dân số. Nếu chỉ lấy mẫu trong một khu vực, một nhóm đối

tượng thì kết quả thu được sẽ không mang tính khách quan và không thể đại diện

cho một quần thể lớn.

Khảo sát một số công trình, chúng tôi thấy trong các nghiên cứu bệnh - chứng,

nhóm bệnh thường được lấy từ số bệnh nhân trong bệnh viện chứ không được lấy

trong dân số.

Ví dụ 2.9: Đề tài nghiên cứu tương quan giữa đột quỵ thiếu máu và các nguy cơ xơ

vữa mạch bao gồm homocysteine huyết tương.

Bằng phương pháp nghiên cứu bệnh - chứng trong đó nhóm bệnh gồm 220

bệnh nhân nhồi máu não điều trị nội trú ở đơn vị đột quỵ và 230 ca chứng. Kết quả:

mức độ homocysteine trung bình trong nhóm bệnh cao hơn nhóm chứng

(p < 0,001). Tỷ lệ tăng homocysteine vừa nhóm bệnh cao hơn nhóm chứng (25,5%

so với 3,9%, p < 0,001).

61

Như vậy, nhóm bệnh trong nghiên cứu này được lấy từ các bệnh nhân nhồi

máu não đang điều trị nội trú ở đơn vị đột quỵ chứ không phải trong dân số.

Trong một số đề tài khác, tác giả tự xác định cỡ mẫu không theo nguyên

tắc nào.

Ví dụ 2.10: Đề tài nghiên cứu về nồng độ Hcy máu.

Bằng phương pháp bệnh - chứng, đề tài này có các mục đích sau:

- Xác định nồng độ Hcy máu ở nhóm bệnh - chứng

- Xác định tỷ lệ tăng nồng độ Hcy máu trung bình ở nhóm bệnh - chứng

- Khảo sát mối tương quan giữa nồng độ Hcy máu với một số yếu tố nguy cơ khác ở

bệnh nhân nhồi máu não cấp.

Nghiên cứu được thực hiện trên nhóm bệnh gồm 50 bệnh nhân được chẩn

đoán nhồi máu não cấp (30 nam, 20 nữ) đang điều trị tại bệnh viện và nhóm chứng

gồm 50 người khỏe mạnh (30 nam, 20 nữ).

Như vậy, trong nghiên cứu này, các tác giả không giải thích lý do tại sao chọn

mẫu gồm 50 đối tượng trong mỗi nhóm.

2.2.2. Bỏ qua điều kiện của các phép kiểm định

Mỗi phép kiểm đều có điều kiện áp dụng khác nhau, nếu vi phạm điều này thì

kết luận rút ra từ các phép kiểm này có thể không có ý nghĩa.

Thế nhưng, một số điều kiện áp dụng thường bị vi phạm bởi nhiều công trình

nghiên cứu. Trong phần mở đầu chúng tôi đã nêu một ví dụ như vậy. Dưới đây là

hai ví dụ khác.

Ví dụ 2.11. Đề tài nghiên cứu về vai trò của CRP trong chẩn đoán

Trong đề tài này, tác giả so sánh nồng độ CRP máu ở người bình thường và ở

bệnh nhân viêm ruột thừa bằng phép kiểm chi bình phương (Chi - squared test) dẫn

đến kết luận nồng độ CRP khác nhau có ý nghĩa TK giữa hai nhóm. Ở đây, nồng độ

CRP là biến số định lượng nên không thể sử dụng phép kiểm chi bình phương để

so sánh.

62

Ví dụ 2.12. Đề tài nghiên cứu đặc điểm lâm sàng và miễn dịch

Tác giả so sánh số lượng tế bào lympho TCD4, TCD8 trong máu trên 28 bệnh

nhân AIDS, thu được kết quả như sau: Số lượng tuyệt đối tế bào TCD4 của bệnh

nhân là: 229 ± 35 tb/ml so với số TCD4 ở nhóm người bình thường khoẻ mạnh là

879 ± 232 tb/ml dẫn đến kết luận lượng tế bào TCD4 giảm có ý nghĩa TK với

p < 0,001.

Số lượng tuyệt đối tế bào TCD8 của bệnh nhân là: 1005 ± 95 tb/ml so với số

TCD8 ở nhóm người bình thường khoẻ mạnh là 659 ±168 tb/ml dẫn đến kết luận

tǎng có ý nghĩa TK với p < 0,001.

Ở đây tác giả đã sử dụng phép kiểm t (Student). Điều kiện sử dụng phép kiểm

này là hai biến cần so sánh có phương sai đồng nhất và DL lấy từ hai dân số có PPC

(Beth Dawson, Robert G.Trapp, 2004).

Với cỡ mẫu n = 28, để so sánh lượng tế bào TCD4 và TCD8 của bệnh nhân

AIDS và người bình thường khỏe mạnh cần phải sử dụng phép kiểm t. Con số đằng

sau dấu ± có thể là độ lệch chuẩn (SD) hoặc sai số chuẩn (SE), nhưng chúng có sự

khác biệt quá lớn (35 so với 232 và 95 so với 168) chứng tỏ phương sai của hai biến

cần so sánh không đồng nhất. Ví dụ 2.13: Đề tài nghiên cứu về chỉ số Na+ trước và sau mổ

Trong nghiên cứu này, 31 bệnh nhân được cắt tuyến tiền liệt qua niệu đạo

bằng bipolar, điều trị u phì đại lành tính tuyến tiền liệt tại bệnh viện. Chẩn đoán xác

định u phì đại lành tính tuyến tiền liệt dựa vào kết quả giải phẫu bệnh. Sự thay đổi huyết sắc tố, Na+ trước và sau mổ (X ± SD) được cho trong bảng 2.3.

Ghi nhận đầu tiên là tác giả đã không giải thích tại sao cỡ mẫu là 31 (không có

công thức nào tính cỡ mẫu xuất hiện trong công trình này).

Bảng 2.3. Hàm lượng huyết sắc tố và Na+ trước và sau mổ

63

Ghi nhận thứ hai là tác giả đã vi phạm điều kiện sử dụng phép kiểm t. Cụ thể

là trong các nghiên cứu bắt cặp trước - sau, để so sánh hai biến số cần phải sử dụng

phép kiểm t hoặc u cho hai mẫu không độc lập (không thể sử dụng cho hai mẫu

độc lập).

Ở đây, trong các tính toán khoảng tin cậy, lý do số bệnh nhân sau mổ giảm 2

người (trước mổ có 31 bệnh nhân, sau mổ chỉ còn 29 bệnh nhân) không được nêu

rõ, nhưng tác giả có đề cập đến 2 trường hợp bị tai biến, biến chứng (1 trường hợp

chảy máu xoang tĩnh mạch trong mổ; 1 trường hợp nhiễm khuẩn niệu sau mổ). Thế

nhưng, để so sánh hai trung bình bằng phép kiểm t ghép cặp trước và sau mổ thì

nhóm bệnh nhân trước và sau mổ phải là một. Nếu 2 bệnh nhân có biến chứng thì

phải loại bỏ trong phần so sánh và chỉ so sánh ghép cặp trên 29 bệnh nhân còn lại.

Trong phần phân tích TK, tác giả so sánh chỉ số huyết sắc tố và Na+ trước và

sau mổ (trong vòng 1 ngày đầu) nhận thấy: huyết sắc tố giảm có ý nghĩa TK so với trước mổ (p < 0,05), trong khi Na+ lại giảm không đáng kể so với trước mổ

(p > 0,05).

Trong phần phương pháp nghiên cứu, tác giả có đề cập việc so sánh các chỉ số

trung bình bằng phép kiểm t, nhưng trong phần phân tích số liệu TK thì không cho

biết đã sử dụng phép kiểm t khi số liệu ghép cặp hay khi 2 mẫu độc lập. Tuy nhiên,

căn cứ vào giá trị p và số bệnh nhân trước và sau mổ khác nhau nên người đọc có

thể thấy tác giả đã sử dụng phép kiểm t đối với 2 mẫu độc lập. Điều này không

chuẩn về phương pháp TK vì cần phải so sánh 2 trung bình khi số liệu ghép cặp

trước và sau mổ, tức là chỉ thực hiện trên một nhóm bệnh nhân nhưng mỗi bệnh

nhân được đo các chỉ số 2 lần trước và sau mổ, không thể dùng phương pháp so

sánh hai trung bình thực nghiệm độc lập.

Có trường hợp cần sử dụng phương pháp KĐ ghép cặp trước - sau thì tác giả

lại sử dụng phép kiểm chi bình phương trong phân tích TK. Chẳng hạn trong một

nghiên cứu về tác dụng điều trị viêm dạ dày, các tác giả so sánh tình trạng viêm (5

thứ bậc: viêm nông, viêm teo nhẹ, viêm teo vừa, viêm teo nặng, và niêm mạc bình

thường) trong một nhóm bệnh nhân trước và sau điều trị. Kết quả nghiên cứu được

64

phân tích bằng phép kiểm chi bình phương với 3 bậc tự do. Việc sử dụng phép kiểm

chi bình phương trong dạng nghiên cứu này là không hợp thức, vì DL thu thập trước

và sau điều trị không độc lập với nhau. (Nguyễn Văn Tuấn, 2012)

2.2.3. Biến đổi và phân nhóm biến số không theo quy luật

Trong nhiều nghiên cứu, tác giả chia biến liên tục thành nhiều nhóm khác

nhau hoặc biến đổi đến một đơn vị khác nhau không theo quy tắc phân nhóm trong

TK và cũng không có lý do lâm sàng nào rõ ràng. Việc phân chia này có thể làm

ảnh hưởng đến kết quả nghiên cứu vì khi phân nhóm không đúng nguyên tắc TK

chắc chắn sẽ bị mất mát thông tin và dẫn đến những kết luận không chính xác.

Chẳng hạn biến số độ tuổi của các đối tượng nghiên cứu là một biến số liên tục

nhưng thường được chia thành nhiều nhóm khác nhau, có đề tài chia nhóm 5 tuổi

như 30 - 35, 35 - 40, 40 - 45, … nhưng có đề tài lại chia nhóm 10 tuổi như 30 - 40,

40 - 50, … Đặc biệt, có một số đề tài tác giả chia nhóm tuổi không thống nhất như

đề tài “Đánh giá hiệu quả điều trị miễn dịch đặc hiệu ở bệnh nhân viêm mũi dị

ứng". Trong đề tài này, các tác giả chia thành nhiều nhóm tuổi: 9 tuổi, 10 tuổi và có

nhóm được chia thành 17 tuổi:

Đề tài được thực hiện với cỡ mẫu là 40 bệnh nhân được chẩn đoán viêm mũi

dị ứng với dị nguyên D.pte. Tác giả phân nhóm tuổi như sau:

từ 9 - 19 tuổi: 13 bệnh nhân (32,5 %), từ 20 - 29 tuổi: 3 bệnh nhân (7,5 %), từ 30 -

39 tuổi: 10 bệnh nhân (25 %), từ 40 - 49 tuổi: 8 bệnh nhân (20 %), từ 50 - 67 tuổi: 6

bệnh nhân (15%).

Tuổi là một biến số liên tục, nếu phân thành nhiều nhóm không đảm bảo đúng

nguyên tắc TK thì các thông tin suy luận từ việc phân nhóm này sẽ không đáng

tin cậy.

2.2.4. Sai sót trong phân tích tương quan

Trong phân tích tương quan, sự tương quan giữa một yếu tố nguy cơ và bệnh

chịu ảnh hưởng của các nhân tố sau đây:

65

- Những sai lệch trong quá trình lấy mẫu và thu thập DL. Đây là những sai lệch có

hệ thống mà nhà nghiên cứu không thể kiểm soát được trong quá trình phân tích

DL.

- Những yếu tố gây nhiễu (hoặc gây nhầm lẫn) là những biến độc lập vừa liên hệ

với một biến độc lập khác và cùng ảnh hưởng lên biến phụ thuộc. Các yếu tố này

tương tự như yếu tố nguy cơ nhưng có thể kiểm soát được trong quá trình phân

tích DL.

- Những yếu tố làm thay đổi hiệu quả tương quan là sự ảnh hưởng giữa các biến độc

lập nhưng không ảnh hưởng trực tiếp lên biến phụ thuộc. Đây là những yếu tố tương

tự yếu tố gây nhiễu, tạo nên hiệu quả tương quan khác nhau trong những nhóm

khác nhau.

Như vậy, trong phân tích tương quan, nhà nghiên cứu cần phải kiểm soát và

phân biệt yếu tố gây nhiễu và yếu tố thay đổi hiệu quả tương quan. Nếu không thực

hiện điều này thì sẽ dẫn đến một kết luận sai hoặc không đáng tin cậy về sự

tương quan.

Chẳng hạn một nghiên cứu hồi cứu về mối liên hệ giữa bệnh nhồi máu cơ tim

và việc dùng thuốc ngừa thai đã kết luận có sự tương quan giữa hai yếu tố này. Tuy

nhiên, tác giả không nhắc đến một yếu tố làm thay đổi hiệu quả tương quan đó là

“hút thuốc lá” vì rằng “hút thuốc lá làm tăng nguy cơ nhồi máu cơ tim ở những phụ

nữ dùng thuốc ngừa thai”. (Lê Trường Giang, 2007)

Ngoài ra, việc chia đối tượng nghiên cứu trong từng lớp quá nhỏ thì kỹ thuật

phân tích tương quan sẽ không đủ mạnh để có thể có được một kết luận có ý

nghĩa TK.

Chẳng hạn một nghiên cứu về mối tương quan giữa độ tuổi và chỉ số BMI kết

luận rằng có sự tương quan thuận giữa hai biến số này ở toàn bộ đối tượng được

khảo sát với hệ số tương quan R = 0,69. Tuy nhiên khi phân thành nhiều nhóm nhỏ

với các độ tuổi khác nhau thì các hệ số tương quan rất thấp, thậm chí một số nhóm

hầu như không có tương quan với R gần như bằng 0. Đây là một sai lầm khá phổ

biến trong các phân tích tương quan vì khi một biến số bị phân chia thành nhiều

66

đoạn thì khoảng cách giữa giá trị nhỏ nhất và lớn nhất của dãy số (range) trong từng

nhóm có sự khác biệt lớn, độ phân tán của DL lớn nên hệ số tương quan trong các

nhóm nhỏ này cũng giảm. Điều đặc biệt quan trọng là khi chia nhỏ DL quan sát thì

cỡ mẫu trong mỗi nhóm khá nhỏ nên các suy diễn từ mẫu nhỏ có thể sẽ không còn

đúng cho dân số lớn.

Trong phân tích tương quan tuyến tính đơn biến, mô hình hồi quy của Pearson

chỉ có giá trị khi các điều kiện sau đây phải thỏa mãn:

- Các biến số độc lập (x) là biến cố định và không có sai sót trong đo lường;

- Phần dư (hiệu số của giá trị quan sát và giá trị dự báo) phải tuân theo PPC;

- Không có tương quan giữa các phần dư.

Rất nhiều nghiên cứu có sử dụng mô hình hồi quy tuyến tính không có phần

kiểm tra các điều kiện này, và cũng không có phần nào nói về những điều kiện này.

2.2.5. Ý nghĩa thống kê và ý nghĩa lâm sàng

Trong một công trình nghiên cứu, để phản ánh tình trạng của bệnh nhân,

không thể chỉ dựa vào một chỉ số lâm sàng mà có thể cần đến nhiều biến số. Nếu số

lượng biến số càng nhiều thì nhà nghiên cứu càng có nhiều cách phân nhóm bệnh

nhân theo các tiêu chí khác nhau như: độ tuổi, giới tính, cân nặng, mức độ bệnh và

như vậy, nhà nghiên cứu có thể phân thành nhiều nhóm nhỏ để phân tích. Trong

một số trường hợp, kết quả phân tích có thể có ý nghĩa TK (p < 0,05) nhưng không

có ý nghĩa lâm sàng.

Chẳng hạn như một nghiên cứu về mối liên hệ giữa lipid và chứng cao huyết

áp, các nhà nghiên cứu đo lường 4 chỉ số lipid như tổng số cholesterol, LDL

cholesterol, HDL cholesterol, và triglycerides trong hai nhóm đối tượng nam và nữ

(nhóm cao huyết áp và nhóm bình thường) tuổi từ 40 đến 70 tuổi. Họ chia các đối

tượng thành 3 nhóm tuổi theo giới tính, cộng với hai nhóm đối tượng thành

12 nhóm nhỏ khác nhau và có thể thực hiện 66 phân tích so sánh. Mỗi so sánh, họ

có thể lặp lại 4 lần (cho 4 chỉ số lipid). Sau khi phân tích trên nhiều nhóm và lặp lại

nhiều lần, các nhà nghiên cứu phát hiện rằng chỉ có triglycerides là khác biệt giữa

nam và nữ, và sự khác biệt này chỉ tìm thấy trong nhóm đối tượng tuổi từ 40 đến 49

67

và chỉ trong nữ giới thuộc nhóm bình thường. Nói cách khác, các nhà nghiên cứu đã

đi ra ngoài mục đích ban đầu của nghiên cứu, và phát hiện được một khác biệt mà

câu hỏi “tại sao” vẫn chưa thể trả lời bằng lí giải sinh học. (Nguyễn Văn Tuấn, 2012)

Trong một số nghiên cứu có chỉ số p > 0,05, theo quy tắc KĐ thì có thể kết

luận sự khác biệt giữa hai nhóm không có ý nghĩa TK. Không chấp nhận điều này,

các tác giả chia DL thành nhiều nhóm nhỏ theo các tiêu chí khác nhau như: độ tuổi,

giới tính, mức thu nhập, … và thực hiện KĐ nhiều giả thuyết cho đến khi phát hiện

một giả thuyết mà kết quả KĐ có ý nghĩa TK.

Phương pháp KĐ giả thuyết TK dựa vào giá trị p vẫn còn nhiều khiếm khuyết

và tranh cãi vì tính không logic của nó, nhưng hiện tại chưa có một phương pháp

nào tốt hơn nên trong hầu hết các công trình, nhà nghiên cứu vẫn sử dụng giá trị p

để kết luận có ý nghĩa TK hay không. Nếu p < 0,05 thì kết luận sự khác biệt có ý

nghĩa TK và ngược lại. Tuy nhiên, ý nghĩa TK không tương đương với ý nghĩa lâm

sàng. Trong nhiều nghiên cứu, một sự khác biệt rất nhỏ nhưng vẫn có ý nghĩa TK

(chẳng hạn p = 0,049) nhưng chưa hẳn đã có ý nghĩa lâm sàng. Ngược lại, có một số

nghiên cứu, kết quả có ý nghĩa lâm sàng nhưng do giá trị p > 0,05 nên tác giả kết

Chẳng hạn một nghiên cứu về hiệu quả của việc bổ sung vitamin C và E ở phụ nữ

mang thai, các nhà nghiên cứu kết luận rằng việc bổ sung vitamin C và E không làm

giảm các triệu chứng lâm sàng nghiêm trọng với p = 0,06 nhưng khi xem xét số liệu

thực tế thì thấy ở trẻ em mà mẹ có bổ sung vitamin C và E thì tỷ lệ giảm triệu chứng

lâm sàng là 21%. Vì p = 0,06 > 0,05 nên các nhà nghiên cứu đã diễn dịch sai kết quả

và đây là sai lầm nghiêm trọng. (Nguyễn Văn Tuấn, 2012)

luận không có ý nghĩa lâm sàng.

2.2.6. Thiết kế nghiên cứu không có nhóm chứng

Các nghiên cứu được thực hiện trên hai nhóm đối tượng dùng để so sánh

hiệu quả của một loại thuốc hoặc một phương pháp điều trị mới. Nhóm 1 sử dụng

thuốc mới hoặc phương pháp điều trị mới, nhóm 2 (nhóm chứng) sử dụng giả dược

(placebo) hoặc điều trị giả. Việc phân chia các đối tượng thành 2 nhóm là rất quan

trọng vì nếu không có nhóm đối chứng thì hiệu quả điều trị sẽ không đánh giá được

vì có một số bệnh nhân tự khỏi bệnh mà không cần điều trị.

68

Ví dụ 2.14: (Moore DS, McCabe GP, 2006). Một nghiên cứu về hiệu quả giảm đau

bằng nước đá lạnh cho các bệnh nhân bị viêm loét dạ dày không có nhóm đối

chứng, các nhà nghiên cứu đã khẳng định bằng cách bơm nước đá lạnh vào dạ dày

những bệnh nhân bị viêm loét sẽ giảm tiết acid và giảm đau. Tuy nhiên, nhiều năm

sau, một nghiên cứu lâm sàng có nhóm đối chứng cho thấy điều ngược lại. Trong

nghiên cứu này, các nhà nghiên cứu chia bệnh nhân thành hai nhóm, nhóm 1 cho sử

C. Kết quả cho thấy nhóm 2 có kết quả giảm đau nhiều hơn nhóm 1.

dụng phương pháp bơm nước đá lạnh vào dạ dày như cũ, nhóm 2 được bơm nước nóng 370

Ví dụ 2.15: Đề tài nghiên cứu về Homocyteine huyết thanh.

Đây là đề tài nghiên cứu không có nhóm chứng nên chưa thể kết luận được

việc tăng Homocyteine là một yếu tố nguy cơ độc lập của bệnh thiếu máu não mà

chính tác giả cũng khẳng định điều này trong phần kết luận của đề tài: “Đây là

nghiên cứu tiền cứu bệnh nhân đột quỵ thiếu máu có nguồn gốc do huyết khối động

mạch cho thấy có sự tăng trung bình homocystenie trong máu các bệnh nhân thiếu

máu não và có sự phối hợp mảng xơ mỡ động mạch cảnh trên bệnh nhân tăng

homocysteine. Tuy nhiên cỡ mẫu quá ít và không có đối chứng, để kết luận tăng

homocysteine là một yếu tố nguy cơ độc lập thiếu máu não cần có một nghiên cứu

rộng lớn hơn và có đối chứng”

Nghiên cứu này khảo sát 100 bệnh nhân (59 nam và 41 nữ), tuổi từ 37 đến 87,

nhập vào đơn vị đột quỵ của bệnh viện. Bệnh nhân cung cấp yếu tố nguy cơ mạch

máu và tiền sử mạch máu, mẫu máu lúc đói phân tích sinh hóa mức độ

homocysteine huyết thanh .

Kết quả nghiên cứu: Hyperhomocysteinemia 62/100 (62%), tăng

homocysteine nhẹ 30% (12,0 –15,1 (mol/l)) trong khi tăng vừa là 32% (>15(mol/l)),

homocysteine huyết thanh trung bình của bệnh nhân đột quỵ 13,878 ( 5,302(mol/l)).

Kết luận: Tăng vừa homocysteine là có phối hợp với đột quỵ thiếu máu, 60%

trong nhóm bệnh nhân đột quỵ thiếu máu và có sự phối hợp giữa nồng độ

homocysteine và mảng xơ mỡ động mạch cảnh.

69

2.3. XS-TK TRONG CHẨN ĐOÁN – ĐIỀU TRỊ

Nếu như qua hai phần trên chúng tôi đã chỉ ra vai trò quan trọng của công cụ

XS-TK trong nghiên cứu y học và những sai lầm liên quan đến việc sử dụng công

cụ này được tìm thấy trong không ít công trình, thì phần tiếp theo dành cho việc

xem xét tác động của công cụ này ở khía cạnh chẩn đoán – điều trị bệnh.

Ngày nay, nhiều nghiên cứu điều tra cơ bản, nghiên cứu can thiệp hoặc nghiên

cứu giải pháp công nghệ của y học đều được toán học hóa để có thể sử dụng công

cụ toán học nhằm tìm ra những kết quả đáng tin cậy, có cơ sở. Nếu các vấn đề được

bao quát cả hai mặt định tính và định lượng thì sẽ có những giải pháp ưu tiên,

những can thiệp kịp thời và hiệu quả. Như vậy cần thiết phải phân tích và so sánh

nhiều số liệu quan sát để tìm ra quy luật, từ đó đề ra các giải pháp thiết thực và có

hiệu quả để bảo vệ sức khỏe con người.

Bản thân từ “chẩn đoán” đã toát lên nghĩa XS của nó. Theo từ điển Tiếng Việt,

chẩn đoán có nghĩa là “xác định bệnh dựa theo triệu chứng và kết quả xét nghiệm”.

Chẩn đoán là một trong những công việc được thực hiện hàng ngày của bác sĩ. Khi

một đối tượng có những triệu chứng khác thường, họ sẽ đến bác sĩ để khám bệnh.

Trong quá trình khám bệnh, bác sĩ đã nghi ngờ đối tượng bị bệnh B nào đó với XS

ban đầu, do bác sĩ nhận định, gọi là XS tiền nghiệm. Nếu những triệu chứng của

bệnh nhân không rõ ràng và chưa thể xác định được bệnh nhân có bị bệnh hay

không, và nếu bị bệnh thì đó là bệnh gì, bác sĩ sẽ chỉ định một hoặc một số thủ tục y

khoa (XN, siêu âm, X quang, nội soi, …), gọi chung là XN, với hy vọng kết quả của

các XN mang lại sẽ giúp ích cho chẩn đoán. Với mục đích đó, bác sĩ cần phải chọn

một (hay một số) XN phù hợp. Một trong những căn cứ để lựa chọn là độ chính xác

của XN, giá trị tiên đoán dương, giá trị tiên đoán âm. Đây chính là các XS có

điều kiện.

2.3.1. Độ chính xác của một XN

Trong kỹ thuật y học, một XN T thể hiện độ mạnh bằng hai thông số: độ nhạy

(sensitivity, ký hiệu là ss) và độ chuyên (specificity, ký hiệu là sp), được định nghĩa

như sau:

70

+

= ss P T

(

B+ /

)

- Độ nhạy (hay dương thật) là khả năng XN cho kết quả dương tính đối với những

người bị bệnh B, tức là .

= sp P T

(

B− /

)

- Độ chuyên (hay âm thật) là khả năng XN cho kết quả âm tính đối với những người

+

T T B

,

,

+ và B− lần lượt chỉ các biến cố:

không bị bệnh B, tức là .

Trong định nghĩa trên, các kí hiệu

XN T cho kết quả dương tính, âm tính, người được chỉ định XN có bệnh và không

có bệnh.

Để đánh giá độ chính xác của một XN, người ta còn sử dụng khái niệm âm giả

và dương giả được định nghĩa như sau:

P T (

B− /

- Âm giả là khả năng XN cho kết quả âm tính đối với người bị bệnh B và được

+ )

diễn tả theo XS có điều kiện là

P T (

B+ /

- Dương giả là khả năng XN cho kết quả dương tính đối với người không bị

− )

bệnh B và được diễn tả theo XS có điều kiện là

P T (

B− /

P T (

B+ /

Dựa vào tính chất của XS, ta có:

+ = 1 - )

+ )

P T (

B+ /

P T (

B− /

Âm giả =

− = 1 - )

− )

Dương giả =

Bản thân các công thức nêu trong định nghĩa khái niệm độ nhạy, độ chuyên,

P T (

B+ /

P T (

B− /

âm giả, dương giả đã cho ta thấy sự can thiệp của XS ở đây. Vấn đề là làm thế nào

+ , )

− . Câu trả lời đến ngay: chúng là các XS có )

để tính các XS

điều kiện nên ta có thể sử dụng công thức Bayes. Nhưng làm sao để có được các XS

thành phần trong công thức này ? Trong y học, câu trả lời là dựa vào một (hay một

số) mẫu được chọn một cách thỏa đáng. Ta nhìn thấy ngay ở đây sự can thiệp của

khoa học TK toán.

Chẳng hạn, để chẩn đoán một đối tượng nghi ngờ bị đái tháo đường, bác sĩ có

thể chỉ định cho đối tượng đó XN nước tiểu hoặc đo nồng độ đường trong máu.

Loại XN thứ hai được xem là XN chuẩn (nếu kết quả XN máu là dương tính thì đối

tượng coi như bị bệnh và sẽ được điều trị, nếu XN máu âm tính thì coi như không

có bệnh). Nhưng loại XN thứ hai mang tính xâm lấn so với loại thứ nhất. Nếu vậy

71

thì phải chăng bác sĩ luôn bắt đầu bằng loại XN thứ nhất ? Câu trả lời là không hẳn

vậy: chọn XN nước tiểu hay không là tùy thuộc vào chẩn đoán ban đầu của bác sĩ

và độ nhạy, độ chuyên của XN đó.

Độ nhạy và độ chuyên ấy được xác định như thế nào ? Tác giả Nguyễn Văn

Tuấn (2011a) chỉ ra câu trả lời với việc dựa vào một bảng TK trên mẫu 1000 người làm XN nước tiểu. Trong bảng đó người bị (B+) hay không bị (B-) bệnh đái tháo

đường đã được xác định bằng cách đo nồng độ đường trong máu.

[Nguồn: Nguyễn Văn Tuấn, 2011a]

Bảng 2.4. Kết quả XN máu và nước tiểu

+

)

+

+

=

=

=

= ss P T

(

/

B

)

0, 059

Căn cứ vào bảng 2.4 người ta tính được:

+ ( P T B + P B ( )

10 /1000 170 /1000

)

=

=

=

= sp P T

(

/

B

)

0,964

Độ nhạy

− ( P T B − P B ) (

800 /1000 830 /1000

+

+

+

= −

P T (

/

B

) 1

P T (

/

B

)

Độ chuyên

+

= −

/

) 1

/

)

( P T

B

( P T

B

= 1 - 0,059 = 0,941 Âm giả =

= 1 - 0,964 = 0,036 Dương giả =

Kết quả nêu trên cho thấy XN nước tiểu có độ nhạy khá thấp (chỉ khoảng 6

%), âm giả khá cao. Ngược lại, XN này có độ chuyên cao (khoảng 96 %) và dương

giả rất thấp. Điều này chứng tỏ XN nước tiểu rất có lợi trong việc xác định một cá

nhân không bị bệnh đái tháo đường nhưng không có lợi trong việc khẳng định một

cá nhân bị bệnh đái tháo đường. Vậy thì bác sĩ chỉ chọn XN nước tiểu khi ông ta

chẩn đoán XS không bị bệnh của người đến khám cao hơn XS bị bệnh.

72

2.3.2. Giá trị tiên đoán

Các thông số liên quan đến độ chính xác của một XN chỉ cho chúng ta biết

khả năng XN dương tính hoặc âm tính, không cho biết ngay XS bị bệnh hay không

bị bệnh của một cá nhân. Nhưng dựa vào đó người ta có thể đưa ra XS bị hay không

bị bệnh. Đây là các XS đưa ra sau khi có kết quả XN nên được gọi là XS hậu

nghiệm hay giá trị tiên đoán (Predictive Value, ký hiệu là PV). Người ta định nghĩa:

+

+

=

(

/

)

PV

+ P B T

- Nếu XN T dương tính (ký hiệu T + ), ta có khái niệm giá trị tiên đoán dương:

. Đây chính là khả năng bị bệnh B nếu XN T dương tính.

=

PV

− P B T

(

/

)

- Nếu XN T âm tính (ký hiệu T − ), ta có khái niệm giá trị tiên đoán âm:

. Đây chính là khả năng không bị bệnh B nếu XN T âm tính.

PV PV+ ,

− . Ngoài ra, XS-TK còn cung cấp thêm những công cụ khác nữa để

Định nghĩa trên cho thấy ngay công thức Bayes cho ta một phương pháp để

tính

tính các giá trị tiên đoán. Để tránh đi quá sâu vào y học cũng như vào XS-TK,

chúng tôi không trình bày các phương pháp này ở đây. Phần Phụ lục 1 sẽ mang lại

một trình bày chi tiết, cho phép thấy XS-TK ảnh hưởng như thế nào vào việc giải

quyết vấn đề tính các giá trị tiên đoán.

PV PV+ ,

Nếu có nhiều XN để hỗ trợ chẩn đoán một bệnh thì bác sĩ phải lựa chọn XN

− cho thấy:

nào ? Các công thức tính

PV + cao (giá trị cao nhất là 1), do đó phải chọn XN có độ chuyên cao.

- Muốn khẳng định bệnh khi XN dương tính thì cần giá trị tiên đoán dương

- Muốn loại trừ bệnh khi XN âm tính thì cần giá trị tiên đoán âm PV − cao (giá

trị cao nhất là 1). Do đó phải chọn XN có độ nhạy cao.

2.3.3. Mô hình ngưỡng

Khái niệm mô hình ngưỡng cho chúng ta thêm một ví dụ về vai trò của XS-

TK trong chẩn đoán và điều trị.

Phát hiện thấy một triệu chứng không bình thường liên quan đến sức khỏe của

mình, người bệnh đến gặp bác sĩ. Sự có mặt của triệu chứng này cùng với tỷ lệ mắc

bệnh trong cộng đồng ở thời gian đó, rồi kinh nghiệm của bác sĩ, … khiến ông nghĩ

có thể người đến khám đã mắc bệnh B. Nhưng những căn cứ đó chưa đủ để có thể

73

khẳng định chắc chắn là bệnh nhân có bệnh. Bác sĩ phải làm gì ? XN là một trong

những công cụ quan trọng giúp bác sĩ đưa ra quyết định điều trị hay không. Tuy

nhiên, cũng không thể quyết định ngay là làm XN và làm XN gì, bởi vì việc chỉ

định một XN không cần thiết hoặc chỉ định sai XN sẽ gây tốn kém về chi phí, thậm

chí có thể gây nên hậu quả xấu cho tình trạng sức khỏe bệnh nhân. Ngoài ra, việc

chỉ định quá nhiều XN có thể làm cho quyết định của bác sĩ trở lên khó khăn hơn vì

nhiễu thông tin hoặc có những XN cho kết quả trái ngược. Do đó, việc lựa chọn các

XN cần làm đóng một vai trò quan trọng trong chẩn đoán và điều trị.

Trước khi chỉ định làm một XN T nào đó, bác sĩ đã đưa ra một XS P(B+), gọi là XS tiền nghiệm để đánh giá XS mắc bệnh B của người đến khám. Giá trị P(B+)

thuộc [0; 1], thường được các bác sĩ đưa ra trong thực hành ở dạng phần trăm. Giá

trị này có thể dựa vào kinh nghiệm của bác sĩ, dựa vào tỷ lệ bệnh lưu hành trong

cộng đồng hoặc TK của phòng khám. Đoạn [0; 1] được chia thành ba vùng: theo

dõi, XN, điều trị. Các mốc phân chia được ký hiệu là Tt và Tγ, gọi là các ngưỡng -

Tt là ngưỡng XN, Tγ là ngưỡng điều trị. - Nếu P(B+) < Tt thì bác sĩ sẽ chưa chỉ định XN và cũng không điều trị mà chỉ để theo dõi bệnh nhân. - Nếu P(B+) > Tγ thì bác sĩ sẽ quyết định điều trị ngay, XN T là vô ích. - Nếu Tt < P(B+) < Tγ thì bác sĩ sẽ chỉ định thực hiện XN T (và những XN khác nữa

nếu thấy cần) để giúp cho việc chẩn đoán.

Mô hình gồm các ngưỡng này do Pauker và Kassier đưa ra vào năm 1980 và

do đó nó còn được gọi là mô hình ngưỡng P-K (xem hình 2.1).

Hình 2.1. Mô hình ngưỡng P - K

Điều quan trọng là phải xác định được hai ngưỡng Tt, Tγ. Một cách xác định

mà các bác sĩ thường sử dụng là căn cứ vào tính chất của XN. Đối với bệnh mà việc

thực hiện XN đơn giản, không xâm lấn (chẳng hạn bệnh viêm dạ dày), ít tốn kém về

74

thời gian và kinh phí thì bác sĩ thường dễ dàng chỉ định XN - khi đó vùng XN rộng

ra, vùng điều trị hẹp lại. Đối với những bệnh mà việc làm XN mang tính xâm lấn

(chẳng hạn bệnh ung thư), tốn kém về thời gian và kinh phí thì bác sĩ ít chỉ định

XN, khi đó vùng điều trị rộng ra, vùng XN hẹp lại. Cách làm này rõ ràng là mang

tính chủ quan, không thực sự mang lại một đánh giá tin cậy cho các ngưỡng.

Thực ra, có thể tránh tính chủ quan của phương pháp trên bằng cách sử dụng

− 1

− 1

+

=

+

=

+

LR .

;

LR .

T γ

T t

B R

B R

 1  

  

 1  

  

công thức sau để tính Tt, Tγ :

trong đó R là tỷ lệ gây rủi ro (Risk) và B (Benefits) là tỷ lệ lợi ích của việc điều trị. Các giá trị LR+, LR- tính được nhờ các công thức của XS mà chúng tôi có trình bày

trong phần Phụ lục 1.

Trên đây là ba loại ứng dụng phổ biến của XS-TK trong chẩn đoán và điều trị

bệnh. Còn có những ứng dụng phức tạp hơn, nhưng chúng tôi sẽ không đi sâu trình

bày chi tiết.

2.4. MỘT NGHIÊN CỨU THỰC TIỄN DẠY HỌC MÔ HÌNH NGƯỠNG

Như vậy, không chỉ trong các nghiên cứu, mà trong chẩn đoán và điều trị XS-

TK cũng đóng vai trò quan trọng. Vậy kỹ năng sử dụng công cụ XS-TK được hình

thành như thế nào cho các bác sĩ tương lai ? Chúng tôi sẽ chọn ngay mô hình

ngưỡng để làm đối tượng tri thức Q và nghiên cứu xem nó đã được đưa vào ra sao

trong dạy học ở Đại học Y Dược Tp HCM. Các khái niệm quan hệ thể chế đối với

Q, tổ chức toán học, tổ chức didactic sẽ được sử dụng ở đây. Cụ thể, trước hết

chúng tôi sẽ làm rõ những praxéologie cần dạy thông qua phân tích cuốn giáo trình

XS-TK do một nhóm GV của trường biên soạn và được sử dụng ở trường này. Để

thuận tiện, chúng tôi dùng ký hiệu V1 để chỉ cuốn giáo trình. Sau đó, chúng tôi sẽ

quan sát giờ dạy của một GV để tìm hiểu những praxéologie được dạy cho SV.

2.4.1. Các praxéologie cần dạy

Khi phân tích các praxéologie cần dạy, chúng tôi thường chỉ dừng ở việc xác

định yếu tố công nghệ mà không đi đến chỗ làm rõ thành phần lý thuyết của chúng.

75

Hiển nhiên, lý thuyết XS cũng như các kiến thức của y học là một tham chiếu quan

trọng phải nói đến khi cần xác định thành phần này

Mô hình ngưỡng được trình bày trong chương cuối cùng Xác suất trong chẩn

đoán của giáo trình V1. Phân tích của chúng tôi đã chỉ ra rằng các praxéologie liên

quan đến mô hình ngưỡng được tổ chức quanh bốn kiểu nhiệm vụ mà chúng tôi ký

hiệu là TĐG, TXĐ, TT, TQĐ. Đó là:

TĐG: Đánh giá XS tiên nghiệm

TXĐ: Xác định các ngưỡng Tt và Tγ

TT: Tính XS hậu nghiệm

TQĐ: Đưa ra quyết định trong chẩn đoán.

Từ những gì được trình bày ngắn gọn về mô hình ngưỡng ở trên, ta thấy TĐG,

TXĐ, TT, là những kiểu nhiệm vụ con của TQĐ. Điều đó sẽ được giải thích rõ hơn ở

phía dưới khi chúng tôi phân tích các kỹ thuật được đưa vào trong V1.

• TĐG: Đánh giá XS tiên nghiệm P(B+)

Kỹ thuật τĐG được trình bày như sau trong V1: dự đoán XS tiên nghiệm (nghĩa

là đánh giá XS bệnh nhân bị bệnh B) bằng cách khám lâm sàng và hỏi bệnh sử.

Công nghệ θĐG giải thích cho τĐG được V1 trình bày rất đơn giản: Trong y học, XS P(B+) được dự đoán bằng cách dựa vào một mặt là tỷ lệ bệnh đang lưu

hành hoặc thống kê của phòng khám, mặt khác là kinh nghiệm của bác sĩ.

• TXĐ: Xác định ngưỡng

- τXĐ: Dựa vào bản chất bệnh hoặc tính chất các yếu tố như độ rủi ro, chi phí, mức

độ làm sáng tỏ của XN T, lợi ích hay bất lợi của việc điều trị tùy theo người bệnh có

bệnh hay không, …

XĐE giải thích

Trong giáo trình V1, kỹ thuật để giải quyết TXĐ và công nghệ θ

"Vị trí của Tt và Tγ thay đổi, tùy thuộc vào nhiều yếu tố: XN có độ rủi ro cao hay thấp,

chi phí thấp hay cao, chính xác nhiều hay ít, và lợi hại của việc điều trị nếu bệnh nhân có

bệnh B hay không.

cho kỹ thuật đó không thể tách rời, như trích dẫn dưới đây đã nêu:

76

Hai giá trị Tt và Tγ chia đoạn (0, 1) thành ba vùng: vùng không điều trị, vùng XN, vùng

điều trị. Mức độ rộng hẹp của vùng này tùy thuộc vào hai giá trị Tt và Tγ, tức là tùy theo

XN T và lợi ích điều trị bệnh B.

Trường hợp XN khá chính xác, ít rủi ro và ít tốn kém, bác sĩ thường cho làm XN đó, dù

khả năng bị bệnh của bệnh nhân cao hay thấp: vùng test rộng ra. Trái lại, nếu XN ít chính

xác hoặc lắm rủi ro thì bác sĩ không muốn chỉ định XN đó: vùng test hẹp lại." (Chu Văn

Thọ và tgk, 2008, tr. 219)

• TQĐ: Ra quyết định lâm sàng trong chẩn đoán

Ở đây người ta sử dụng mô hình ngưỡng bằng cách dựa vào XS p. p có thể là P(B+) hay PA (gọi là XS hậu nghiệm, tính được tùy vào việc kết quả XN - nếu đã

thực hiện - là dương tính hay âm tính), tùy theo ở thời điểm nào của quá trình chẩn

bệnh. Kỹ thuật τXĐ được mô tả như sau:

- Nếu p < Tt: quyết định không cho điều trị

< <

p Tγ

- Nếu p > Tγ: điều trị ngay

tT

- Nếu : chỉ định một XN (nếu p là P(B+) ) hay một XN khác (nếu

p là PA) để đánh giá tốt hơn XS mà người ta có thể gán cho khả năng bệnh nhân

mắc bệnh.

"Mô hình ngưỡng giải thích việc bác sĩ làm XN hay không với việc cho điều trị bệnh B hay

không, là tùy vào p rơi vào vùng nào. Mỗi vùng rộng hay hẹp tùy vào vị trí của

tT và Tγ .

Hai giá trị ngưỡng này tùy thuộc vào:

- Rủi ro, tốn kém và độ chính xác của T.

- Ích lợi và tai hại của việc điều trị bệnh B" (Chu Văn Thọ và tgk, 2008, tr.220)

θQĐ: đây là phần giải thích cho kỹ thuật tìm thấy trong V1:

Như vậy θQĐ là mô hình ngưỡng P – K.

• TT: Tính XS hậu nghiệm

Trong trường hợp đã cho bệnh nhân làm XN T, bác sĩ cần tham khảo kết quả

XN để đánh giá (lần thứ hai) XS người này mắc bệnh B. Nói cách khác, bác sĩ phải

thực hiện kiểu nhiệm vụ T – tính XS hậu nghiệm.

Giáo trình V1 mà chúng tôi phân tích đưa ra ba kỹ thuật để giải quyết kiểu

nhiệm vụ này.

77

P B T+

/

− )

- τT: Dùng công thức Bayes

P B T+

/

+ )

- Nếu T- (kết quả XN T là âm tính): tính p = (

- Nếu T+ (kết quả XN T là dương tính): tính p = (

T giải

/

(

)

=

P B A / )

(

). ( P B P A B P A ) (

thích cho kỹ là công thức Bayes: Công nghệ θ thuật τT

- τ’T: Dùng phương pháp bảng 2 × 2

Bảng 2 × 2 biểu thị độ nhạy và độ chuyên của XN T (hai tham số cho phép

đánh giá mức độ chắc chắn của T). V1 đã đưa vào bốn công thức để tính độ nhạy và

độ chuyên của T.

- τ"T: Dùng phương pháp tỷ cơ hội

+

+

+

+

=

=

LR T (

)

LR A ( )

Tỷ cơ hội của biến cố A, ký hiệu LR(A), được xác định theo công thức

+

( P T P T (

B B

) )

/ /

P A B / P A B /

( (

) )

+

=

LR T (

)

. Nếu A là T+ thì , ký hiệu là LR+ nếu A là T -

P T ( P T (

B B

) )

/ /

, ký hiệu là LR− . thì

Sau đó V1 đưa vào các các công thức tính XS hậu nghiệm. Các công thức đó phụ thuộc vào P(B+), độ nhạy, độ chuyên và kết quả XN. Những kỹ thuật này khá

cồng kềnh nên chúng tôi không đi sâu vào việc giới thiệu chúng.

Tóm lại, có 4 kiểu nhiệm vụ liên quan đến mô hình ngưỡng. Bản chất của

chúng là gì ? TT: là một kiểu nhiệm vụ toán học. Một trong những kỹ thuật để giải

quyết là sử dụng công thức Bayes đã được V1 đưa vào trước đó. TĐG không phải là

kiểu nhiệm vụ toán học dù kỹ thuật τĐG có bao gồm việc so sánh hai số. Ta cũng có

thể nói như vậy đối với TQĐ. TXĐ, theo cách trình bày của V1 cũng không phải là

một kiểu nhiệm vụ toán học. Kỹ thuật τXĐ mà giáo trình đề cập đến là căn cứ vào

các yếu tố như rủi ro, chi phí và độ nhạy của XN mà người ta định chọn với hy vọng

có những thông tin thỏa đáng cho phép khẳng định bênh nhân có bệnh hay không.

Kỹ thuật đó cũng phải tính đến lợi hại của việc điều trị nếu bệnh nhân có bệnh hay

78

không có bệnh, …Chẳng hạn, nếu bệnh đó là ung thư ở giai đoạn cuối thì bác sĩ sẽ

xem rằng khoảng điều trị rất hẹp.

Mô hình của Castelat mang lại một cái nhìn rõ ràng về thành phần công nghệ

bao gồm các yếu tố của y học. Như chúng

của các praxéologie tạo thành từ TĐG, TQĐ, TXĐ. Bởi vì đây là những kiểu nhiệm vụ chẩn bệnh và điều trị nên thành phần θth

tôi đã chỉ ra, trong V1 kỹ thuật và công nghệ của các praxéologie này không tách rời

không mang lại một lời

nhau. Dường như điều đó làm cho kỹ thuật (và cả công nghệ) đều không rõ ràng. Sự không rõ ràng đó lại càng lớn hơn khi mà thành phần θp

giải thích đầy đủ cho kỹ thuật được giới thiệu trong V1 (chẳng hạn, "dựa vào các

yếu tố như độ nguy hiểm, chi phí XN và mức độ làm sáng tỏ của XN,…" để xác định

các ngưỡng). Chúng tôi tự hỏi phải chăng đây là nguồn gốc khó khăn của SV

y khoa.

− 1

− 1

+

=

+

=

+

LR .

;

LR .

T γ

T t

B R

B R

 1  

  

 1  

  

Thực ra thì lý thuyết XS cung cấp cho ta công thức để tính như sau:

trong đó R là tỷ lệ gây rủi ro (Risk) và B (Benefits) là tỷ lệ lợi ích của việc điều trị.

Như thế, praxéologie gắn liền với TXĐ đã không được thiết lập một cách đầy

đủ: kỹ thuật toán học không được đưa vào trong giáo trình. Hệ quả là SV thiếu

những kỹ thuật thỏa đáng để chẩn đoán và điều trị cho bệnh nhân.

2.4.2. Phân tích thực tế DH

Lớp học mà chúng tôi quan sát là một lớp năm thứ hai của Đại học Y dược Tp

HCM. Tiết học này nghiên cứu mô hình ngưỡng P – K.

Từ băng ghi âm và những ghi chép khi quan sát, chúng tôi dựng lại biên bản

của tiết học (Phụ lục 2). Trong phần dưới, những trích dẫn in nghiêng được lấy từ

biên bản đã được phân thành 48 đoạn. Người ta dạy cho các bác sĩ tương lai những

gì về việc sử dụng mô hình ngưỡng trong tình huống điều trị ? Trong khuôn khổ có

hạn của luận án này chúng tôi chỉ trình bày vắn tắt dưới đây những điểm chủ yếu rút

ra từ phân tích tiết học đã quan sát. Phân tích được thực hiện theo mô hình tổ chức

didactic của Thuyết nhân học.

79

• Đoạn 1 – 8: GV bắt đầu bằng việc giới thiệu mô hình ngưỡng. Đây là thời

điểm gặp gỡ lần đầu tiên với kiểu nhiệm vụ TQĐ - ra quyết định lâm sàng.

Ta thấy là kiểu nhiệm vụ TQĐ đã được nghiên cứu trước TĐG, TXĐ, và TT. Mô

hình ngưỡng là yếu tố công nghệ của τQĐ. Khi quan sát giờ học, chúng tôi thấy là kỹ

thuật τQĐ được đưa vào tường minh ngay sau đó, không kèm theo ví dụ.

• Đoạn 9 – 14: Nghiên cứu kiểu nhiệm vụ TĐG – đánh giá XS tiền nghiệm.

Như chúng tôi đã nói, TĐG không phải là một kiểu nhiệm vụ toán học. Kỹ thuật τĐG

được xây dựng thông qua một ví dụ về chẩn đoán bệnh Wilson.

• Đoạn 15 - 18: trở lại với kiểu nhiệm vụ TQĐ.

Đoạn này ứng với thời điểm làm việc với kỹ thuật τQĐ thông qua ví dụ về chẩn

18. Trong bệnh suyễn, ta chọn ngưỡng XN là 10%, ngưỡng điều trị là 80%. Ta có (GV

viết lên bảng):

Sau khi khám lâm sàng bác sĩ sẽ đánh giá P(B+). Nếu P(B+) < 0,1 thì bác sĩ quyết định

chưa điều trị, cũng không làm XN mà chỉ để theo dõi thêm. Nếu P(B+) > 0,8 thì cần điều trị ngay. Nếu 0,1 < P(B+) < 0,8, bác sĩ hy vọng kết quả hô

hấp ký sẽ giúp chẩn đoán hay loại trừ được bệnh suyễn và cho bệnh nhân làm XN đó.

đoán bệnh suyễn.

Như vậy, SV làm việc trên mô hình ngưỡng vừa được đưa vào thông qua

tT và Tγ đã cho ( tT = 0,1 và Tγ = 0,8). Nhưng GV không đưa

một ví dụ, trong đó

ra một lời giải thích nào về cách thức tính toán để có các giá trị này. Thời điểm

làm việc với kỹ thuật τQĐ do GV thực hiện, không có sự tham gia của SV.

• Đoạn 19 – 25: Thời điểm nghiên cứu kiểu nhiệm vụ TXĐ.

Ví dụ trên làm nảy sinh nhu cầu nghiên cứu kiểu nhiệm vụ TXĐ. Nhu cầu này

19. (SV): Làm sao ta biết được

tT = 0,1 và Tγ = 0,8 ? Làm thế nào để xác định hai

ngưỡng này ?

được một SV đưa ra.

80

Hai kỹ thuật xác định các ngưỡng đã được GV giới thiệu. Kỹ thuật thứ nhất,

ký hiệu τXĐ, tương ứng với kỹ thuật đã được nói đến trong giáo trình V1: nó không

chứa đựng một yếu tố số nào và dựa vào những kiến thức nghề nghiệp. Nhưng sau

đó GV đã tách khỏi giáo trình bằng cách bình luận về phương pháp tìm ngưỡng vừa

25. (GV): Để khắc phục nhược điểm của phương pháp chỉ dựa chủ yếu vào kinh

nghiệm, một số tác giả đã đề nghị sử dụng hai công thức sau:

1

1

+

=

+

=

+

LR

LR .

.

;

T γ

T t

B R

B R

 1  

  

 1  

  

Trong đó R là tỷ lệ gây rủi ro (Risk), B là tỷ lệ lợi ích (Benefits)”.

dạy và bổ sung cho nó hai công thức (kỹ thuật τ'XĐ).

Các yếu tố lý thuyết không được trình bày. Kỹ thuật mới τ'XĐ được đưa vào

không được GV giải thích.

=

p P B+ (

)

• Đoạn 29: Nhắc lại kỹ thuật τQĐ đã được thể chế hóa ở đoạn 17. Tuy nhiên,

là XS tiên nghiệm. Việc nhắc lại được làm với mục vào thời điểm đó thì

đích đưa vào kiểu nhiệm vụ TT - xác định XS hậu nghiệm, xuất hiện như một kiểu

nhiệm vụ con TQĐ.

• Đoạn 30 - 34: GV trình bày kỹ thuật τT (sử dụng công thức Bayes).

Chúng tôi nhắc lại rằng đối với kiểu nhiệm vụ TT còn tồn tại hai kỹ thuật khác

– sử dụng bảng 2×2 và dùng tỷ cơ hội, đã được dạy trước khi nghiên cứu mô hình

ngưỡng. Nhưng GV không nói đến hai phương pháp này. Một cơ hội so sánh các kỹ

thuật và đánh giá chúng đã không được tận dụng. Hai kỹ thuật đã biết nhưng bị loại

đi không được giải thích tại sao.

• Đoạn 35 - 45: thời điểm làm việc với bốn kiểu nhiệm vụ và các kỹ thuật đã

dạy. Các kỹ thuật khác nhau được sử dụng thông qua một ví dụ về chẩn đoán bệnh

B cho một bệnh nhân.

• Đoạn 46 - 47: thể chế hóa lần nữa các kỹ thuật vừa đưa vào. Các yếu tố

công nghệ - lý thuyết không được nhắc lại.

Phân tích trình bày ở trên cho ta thấy là trong tiết học đã quan sát chỉ có một

praxéologie duy nhất được dạy - nó xoay quanh kiểu nhiệm vụ TQĐ.

81

Trong praxéologie này, TĐG, TXĐ và TT là ba kiểu nhiệm vụ con của TQĐ và do

đó chúng tham gia vào kỹ thuật đưa ra quyết định trong tình huống chẩn bệnh.

Chỉ có TXĐ, và TT là những kiểu nhiệm vụ mà để giải quyết sẽ tồn tại những

kỹ thuật toán học. Thay vì chỉ trình bày kỹ thuật dựa vào kinh nghiệm nghề nghiệp

của bác sĩ như giáo trình V1, GV đã đưa thêm kỹ thuật τ'XĐ. Đối với TT , chỉ một

trong ba kỹ thuật toán học có mặt trong V1 được GV dạy. Ta có thể nói praxéologie

liên quan đến TXĐ được dạy là một praxéologie hỗn hợp, phối hợp giữa tri thức toán

học với tri thức nghề nghiệp.

Về việc soạn thảo các yếu tố công nghệ và lý thuyết, ta thấy chúng chủ yếu

mang đặc trưng nghề nghiệp trong đó có căn cứ vào kinh nghiệm của bác sĩ đối với

bệnh này hay bệnh kia: những yếu tố công nghệ - lý thuyết mang bản chất toán học

của các praxéologie được dạy đã vắng mặt, dù có những kỹ thuật toán học được đưa

vào. Ta có thể đặt ra câu hỏi hệ về hệ quả của sự không đầy đủ của những

praxéologie được dạy đối với việc làm chủ vấn đề chẩn bệnh để điều trị cho bệnh

nhân – một nhiệm vụ chủ yếu của bác sĩ.

2.5. KẾT LUẬN CHƯƠNG 2

Mục đích của các nghiên cứu y học nhằm cải thiện phương pháp điều trị,

hoạch định các chính sách y tế, mang lại lợi ích cho sức khỏe cộng đồng, nâng cao

chất lượng điều trị và chăm sóc bệnh nhân. Hầu hết các nghiên cứu y học đều có sự

đóng góp của XS-TK trong phân tích DL, trong ước lượng khoảng tin cậy và trong

KĐ giả thuyết, trong quyết định lâm sàng.

Việc kết hợp giữa các phương pháp TK như ước lượng khoảng tin cậy, KĐ giả

thuyết TK và các phương pháp chẩn đoán y học dựa trên XS tiền nghiệm, XS hậu

nghiệm, mô hình ngưỡng, … là một trong những biện pháp nâng cao tính chính xác

của các chẩn đoán y học, góp phần tích cực trong công tác điều trị và chăm sóc

bệnh nhân.

Phân tích trong chương này cho thấy XS-TK đóng vai trò quan trọng trong

lĩnh vực phòng bệnh, chẩn đoán, điều trị, tư vấn cho bệnh nhân cũng như trong các

nghiên cứu y học. Thực tế đã chứng tỏ rằng, nếu chỉ dùng kinh nghiệm cá nhân rút

82

ra được sau một vài lần điều trị thử mà không có các phương pháp kiểm tra đánh giá

bằng các bằng chứng khoa học thì phương pháp điều trị đó thường có độ tin cậy

không cao, thậm chí nguy hiểm cho tính mạng của người bệnh.

Để đưa ra các quyết định đúng đắn, người thầy thuốc phải cân nhắc, tổng hợp

các thông tin từ nhiều nguồn khác nhau như: kết quả XN, chẩn đoán hình ảnh, thăm

dò chức năng từ các nghiên cứu, thử nghiệm lâm sàng, v.v…. Như chúng tôi đã

phân tích, việc sử dụng tổng hợp các thông tin này đòi hỏi một số kiến thức về XS-

TK. Tuy nhiên, nhiều cán bộ y tế, nhiều nhà nghiên cứu trong lĩnh vực y tế chưa

được đào tạo và cập nhật các kiến thức về XS - TK, về các phần mềm TK trong

phân tích và xử lý DL, … nên khó tránh khỏi những sai sót trong nghiên cứu, trong

việc hoặch định chính sách y tế, ảnh hưởng đến hiệu quả điều trị và chăm sóc sức

khỏe cho bệnh nhân. Hậu quả của những sai sót này thì thường không nhỏ: ảnh

hưởng đến sức khỏe cộng đồng, thậm chí nguy hiểm đến tính mạng của bệnh nhân

khi đưa ra các quyết định sai lầm.

Những sai sót này có gặp ở SV y khoa hay không ? Phương pháp nào giúp hạn

chế và khắc phục sai sót ? Hai câu hỏi đó sẽ được xem xét trên một đối tượng tri

thức XS-TK cụ thể khi chúng tôi phân tích quan hệ thể chế và quan hệ cá nhân SV

đối với tri thức này.

83

CHƯƠNG 3

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

VÀ PHÂN PHỐI CHUẨN: MỘT PHÂN TÍCH TRI THỨC LUẬN

Ba bài toán cơ bản của lý thuyết TK là chọn mẫu, ước lượng các tham số (với

độ chính xác chọn trước) và KĐ giả thuyết TK. Chúng tôi đã chỉ rõ trong chương 2

là ba bài toán này luôn có mặt trong mọi nghiên cứu của y học.

Nhằm làm rõ cơ sở tham chiếu cho phân tích tri thức cần dạy và tri thức được

dạy ở hai chương tiếp theo, chúng tôi cần phải thực hiện một nghiên cứu tri thức

luận về đặc trưng của đối tượng tri thức muốn nghiên cứu.

Phần thứ nhất của chương dành cho việc trình bày một phân tích tri thức luận

về đối tượng KĐ giả thuyết TK. Ở đây chúng tôi sẽ chỉ ra một cách ngắn gọn các bài

toán KĐ giả thuyết TK, các phương pháp KĐ giả thuyết TK và các loại giả

thuyết TK.

Trong phần này chúng tôi không bàn nhiều về lí thuyết KĐ giả thuyết TK.

Vấn đề là để giải quyết bài toán đó thì điều kiện PPC của DL có vai trò quan trọng.

Chính vì thế nên chương này còn đề cập đến phân tích tri thức luận về PPC. Thông

qua việc nghiên cứu quá trình hình thành và phát triển của luật PPC, giả thuyết được

áp dụng phổ biến khi thực hiện KĐ giả thuyết TK và làm nên nền tảng của phân

tích TK, chúng tôi cố gắng làm rõ những đặc trưng tri thức luận cơ bản của đối

tượng tri thức đang bàn đến.

3.1. PHÂN TÍCH TRI THỨC LUẬN VỀ KIỂM ĐỊNH GIẢ THUYẾT TK

Điểm qua về quan điểm triết học, từ thời Hy Lạp cổ đại đến thế kỷ 16, thực sự

không có khái niệm KĐ giả thuyết. Thế giới quan lúc đó được quy định theo các

lược đồ tổng thể, nhận thức thế giới theo con đường suy luận diễn dịch, đòi hỏi diễn

giải chứng cứ ăn khớp với lý thuyết. Sang thế kỷ 17, Bacon viết Novum Organum

đặt lại cơ sở tri thức về thế giới dựa trên tiến trình quy nạp, nhận thức phải đi từ

quan sát tỉ mỉ tích lũy bằng chứng, tổng hợp các đặc thù riêng rẽ đến kết luận tổng

quát. Tư tưởng khoa học khuyến khích tìm và chấp nhận các ví dụ phản biện có sức

84

mạnh thuyết phục chứ không chấp nhận giáo điều chỉ đi tìm ví dụ khẳng định cho

một lý thuyết nào đó.

Từ đây hình thành thế giới quan khoa học mang bản sắc Newton, theo đó vật

chất hiện hữu tuân theo định luật và có cấu trúc xác định trong không gian và thời

gian. Khám phá thế giới là tìm ra các định luật này dựa vào quan sát, thực nghiệm

và suy luận quy nạp. Ngày nay, thế giới được quan niệm là một hệ thống phức hợp

không phải có thể quan sát toàn bộ, nhưng có thể thăm dò cấu trúc và tính toán. Các

sự kiện diễn ra thế nào phụ thuộc vào vị trí người quan sát và phương pháp

quan sát.

Phương pháp quy nạp đặt cơ sở nhận thức trên việc thu thập chứng cứ và thực

hành thử nghiệm, sự kiện có thể kiểm chứng và thử nghiệm có thể lặp đi lặp lại,

không chấp nhận các định kiến về kết quả thử nghiệm. Về thực hành, quy trình quy

nạp gồm các bước:

- Quan sát thu thập DL, loại bỏ các thành tố không thích đáng.

- Thử nghiệm kiểm tra giả thuyết

- Điều chỉnh giả thuyết

- Lập lý thuyết trên cơ sở thực nghiệm, DL và giả thuyết.

Lý thuyết đã được chứng minh là đúng phản ánh định luật, định luật không

bao giờ tuyệt đối đúng vì không thể chứng minh nó đúng tuyệt đối, định luật được

tạm chấp nhận đến lúc được chứng minh là sai. Hiện tượng lý thuyết không tương

hợp với các DL chứng cứ mới cho thấy lý thuyết luôn có khả năng sai và có thể

kiểm nghiệm sai, đây là đặc tính phản nghiệm khoa học.

Như vậy khoa học không hoàn toàn khách quan cũng không chủ quan, mà là

những hệ thống phát biểu về quan hệ giữa các sự kiện như đã được quan sát. Phản

biện khoa học là rất cần thiết, để lựa chọn các lý thuyết phù hợp nhất. KĐ giả thuyết

vì thế là một công cụ phân tích và phản biện rất sắc bén và hữu hiệu.

Mọi hoạt động trong tự nhiên và xã hội khi xảy ra đều tác động lên và chịu tác

động ngược của các hệ thống và quá trình phức hợp đan xen nhau, mà sự phân tán

biến động đều tồn tại trong mỗi quá trình, mỗi hệ thống. Vì vậy hiểu và giảm thiểu

85

biến động là con đường dẫn đến thành công và công cụ TK ứng dụng ngày càng trở

nên cần thiết. KĐ giả thuyết TK là công cụ thiết yếu để đi đến hiểu biết đúng và là

công cụ tạo chọn lọc tự nhiên đối với các lý thuyết khoa học.

Bản chất tự nhiên của tư duy yêu cầu điểm dựa của suy luận phải vững chắc

trên các định luật nghiêm ngặt và các quyết định theo đó phải rõ ràng, dứt khoát.

Tuy nhiên các số liệu thường biến động và có sự phân tán, nên các thông tin rút ra

cũng vừa bất định vừa bất toàn. Do đó tính chất ngẫu nhiên luôn tồn tại không thể

nào tách bỏ khỏi kết quả, gây ra khó khăn cho cả lập luận lẫn nhận thức.

Theo từ điển Hán - Việt, giả có nghĩa là ví, phỏng, nếu; thuyết nghĩa là chủ

trương, ngôn luận. Giả thuyết TK là một giả thuyết khoa học về tham số, về luật

phân phối hoặc về tính chất của biến ngẫu nhiên mà người ta muốn nghiên cứu trên

một tổng thể xác định thông qua việc quan sát, phân tích DL thu được từ mẫu. Bản

chất của KĐ giả thuyết TK là so sánh những gì quan sát được trong thực nghiệm

với những gì xảy ra nếu giả thuyết đặt ra là đúng. Mặc dù vẫn còn một số giới hạn

của các mô hình KĐ giả thuyết và có tranh cãi về những mô hình này, các nhà TK

học vẫn phải thừa nhận rằng KĐ giả thuyết TK đã ăn sâu vào trong khoa học.

3.1.1. Kiểm định giả thuyết thống kê trong lịch sử

KĐ giả thuyết được biết đến sớm nhất là thử nghiệm Pyx, một hình thức được

tổ chức định kỳ của Hoàng Gia Anh, thiết lập vào năm 1279. Thử nghiệm Pyx là

một KĐ về chất lượng của đồng tiền xu được phát hành. Trong mỗi lần chế tạo tiền

xu, một số lượng nhỏ đồng xu sẽ được lưu trữ trong các hộp gỗ. Hội đồng KĐ sẽ so

sánh giữa đồng xu được lưu trữ với đồng xu chuẩn để đánh giá về chất lượng và

thành phần của chúng. Trong mỗi lần thử nghiệm này thì giả thuyết đặt ra là:

H0: Đồng xu đúng chuẩn quy định, H1: Đồng xu không đúng chuẩn quy định

Từ năm 1700, các nhà thiên văn học thường xuyên sử dụng KĐ giả thuyết để

kiểm tra xem có hay không sự chênh lệch về số đo các thiên thể với mục đích muốn

biết chính xác vị trí của mặt trăng cho các mục đích hàng hải. Để làm được điều

này, các nhà thiên văn học sẽ so sánh giá trị khác biệt theo luật sai số, phân phối của

86

sai số (tuân theo PPC) về vị trí thực của mặt trăng theo âm lịch và giả thuyết đặt

ra là:

H0: Số đo trong mức giới hạn sai số cho phép; H1: Số đo ngoài mức giới hạn sai số

cho phép

Cũng như thử nghiệm Pyx, mỗi phép KĐ giả thuyết về thiên văn có một kết

cục nhị phân: sai số hoặc trong hoặc ngoài độ lệch cho phép. Các thử nghiệm này

nghiêng về thiết kế thử nghiệm hơn và mang tính chất hiệu chỉnh sai số.

Năm 1710, John Arbuthnot quan sát thấy tỷ lệ sinh con trai có lớn hơn tỷ lệ

sinh con gái chút ít, ông đặt giả thuyết về khả năng sinh trai gái như nhau và tính

toán trên số liệu thực nghiệm cho thấy giả định này rất không chắc chắn, XS là

20

1 4836 10×

. Ông lập luận rằng đây là chứng minh cho ý Chúa, con trai phải có mức

rủi ro chết non cao hơn con gái. Đây có thể coi là một KĐ giả thuyết TK với đầy đủ

ý nghĩa và quy trình.

Từ năm 1800 đến đầu những năm 1900, khái niệm tỷ chọi (odds) ra đời. Tỷ

chọi diễn tả tỷ số giữa khả năng xảy ra và không xảy ra của một biến cố và nếu tỷ

chọi càng lớn thì khả năng xảy ra của biến cố lớn hơn khả năng không xảy ra của

biến cố đó (Xem bảng 3.1). Theo đó, tỷ chọi chống lại việc bác bỏ giả thuyết không

− 1 α α

là .

Hình 3.1. Phân phối chuẩn

Tỷ số giữa 1 - α và α là tỷ chọi chống lại việc bác bỏ giả thuyết không.

87

Bảng 3.1. Các mức ý nghĩa giữa năm 1837 và 1908

[Nguồn: Douglas Curran-Everentt, 2009]

Năm 1900, Karl Pearson đề xuất KĐ chi bình phương nhằm so sánh phân phối

của tần số quan sát được và phân phối giả định theo lý thuyết.

Trong tác phẩm “The Probable Error of a Mean” (Sai số có thể của một trung

bình), William S. Gosset đã đưa ra một thủ tục mà sau này trở thành phép kiểm t

Đầu tiên, chúng ta tìm xác suất mà thuốc A làm tăng thời gian ngủ trung bình (tìm tỷ

số giữa trung bình mẫu và độ lệch chuẩn của mẫu) trong bảng mức ý nghĩa với 10

thực nghiệm bằng cách nội suy. Tỷ chọi là tỷ số giữa 0,887 và 0,113 tức là khoảng

8:1, tương ứng với đường cong chuẩn khoảng 1,8 lần sai số có thể. Từ đó có thể suy ra

rằng thuốc A làm tăng thời gian ngủ nhưng sẽ không ngạc nhiên nếu kết quả có thể bị

đảo ngược bởi các thực nghiệm khác. (Douglas Curran-Everentt, 2009)

một mẫu.

Theo thuật ngữ hiện tại thì thuật ngữ 1,8 lần sai số có thể có nghĩa là t = 1,8

trong phép kiểm t.

Năm 1919, lấy cảm hứng từ tác phẩm “The Probable Error of a Mean” của

Gosset, Fisher đã đề nghị rằng các nhà khoa học thực nghiệm cần thiết phải có một

người hướng dẫn thực hành về các phương pháp TK và ông đã viết cuốn “Statistical

Methods for Reseach Workers”. Trong tác phẩm này, Fisher đã 3 lần trích dẫn tiêu

chuẩn 5%. Ông cũng là người đầu tiên nhận ra tính chất tùy hứng của giá trị

Trong các ứng dụng chúng ta thường không muốn biết tần số tại bất kỳ khoảng cách

nào từ trung tâm khi tần số tổng cộng vượt quá khoảng cách đó; điều này được thể

hiện bằng diện tích đường cong điểm cắt tại bất kỳ điểm nào. Một độ lệch vượt quá độ

lệch chuẩn xảy ra khoảng một lần trong 3 thử nghiệm, 2 lần trong 22 thử nghiệm, 3

ngưỡng này.

88

lần trong 370 thử nghiệm. Giá trị p = 0,05, hoặc 1 trong 20, là 1,96 hoặc gần 2. Đây là

điểm thuận lợi để đánh giá xem độ lệch có thể được xem là có ý nghĩa hay không. Vì

vậy, độ lệch vượt quá hai lần độ lệch chuẩn được chính thức coi là có ý nghĩa.

(Douglas Curran-Everentt, 2009)

Năm 1925, ông trình bày toàn vẹn quan điểm mới, theo đó các số liệu được

xét như kết quả quả một biến ngẫu nhiên, biến ngẫu nhiên này được giả sử có một

phân phối XS. Mô hình của Fisher được ông gọi là “Test of Significance” (KĐ

mức ý nghĩa). Theo Fisher thì TK sử dụng phương pháp suy luận theo quy nạp toán

học, tức là phương pháp suy luận dựa vào quan sát các mẫu nhỏ rồi khái quát cho

dân số. Phương pháp này được thực hiện theo 3 bước như sau:

Bước 1: Đặt một giả thuyết H0 (giả thuyết không) là giả thuyết ngược lại với

những gì mà nhà nghiên cứu tin là sự thật.

Bước 2: Thu thập DL D liên quan đến H0

Bước 3: Ước tính XS DL D xảy ra nếu H0 là đúng, tức là tính p = P(D/ H0).

Theo Fisher giá trị p chỉ ra mức độ sai lệch của DL so với giả thuyết H0, p

càng nhỏ thì mức sai lệch càng lớn. Fisher đề nghị một tiêu chuẩn chủ quan nếu p từ

0,1 đến 0,9 thì không nghi ngờ gì về giả thuyết, nếu p dưới 0,02 thì rõ ràng giả

thuyết không tương hợp với tất cả DL, nếu p < 0,05 thì có thể kết luận không sai

lầm rằng DL không phù hợp với giả thuyết H0. Fisher không đưa ra giả thuyết chính

H1 (giả thuyết mong muốn của nhà nghiên cứu, giả thuyết thay thế khi H0 bị bác

bỏ) vì theo quan điểm của Fisher thì chỉ có thể kết luận bằng chứng dựa vào DL có

phù hợp với giả thuyết hay không chứ không thể bác bỏ hay chứng minh giả thuyết.

Năm 1928, Jerzy Neyman và Egon Pearson phê phán quan điểm của Fisher

nhất là sự tùy hứng trong chọn lựa KĐ TK. Theo hai ông, sức mạnh KĐ của bằng

chứng cần tách riêng khỏi nguy cơ sai lầm khi quyết định về giả thuyết. Tiêu chuẩn

tùy hứng khi chọn giá trị ngưỡng 0,05 là hoàn toàn chủ quan và vấn đề quyết định

phải được xây dựng theo quy trình hợp lý có luật bác bỏ/chấp nhận và có đánh giá

khả năng sai lầm. Neyman và Pearson cho rằng phương pháp của Fisher là vô

nghĩa, hai ông khẳng định việc chọn lựa KĐ TK nào và tiêu chuẩn KĐ nào phải

dựa vào cả giả thuyết H0 lẫn một giả thuyết thay thế H1 (hay HA). Từ đó, hai ông

89

thiết kế phương pháp “Test of Hypothesis” (KĐ giả thuyết). Mô hình của Neyman

và Pearson được thực hiện như sau:

Bước 1: Đặt giả thuyết không H0 và giả thuyết chính H1

Bước 2: Quyết định mức ý nghĩa α (XS bác bỏ H0 khi H0 đúng) và β (XS

không bác bỏ H0 khi H0 sai).

Bước 3: Thu thập DL liên quan đến giả thuyết và KĐ phân phối của DL.

Bước 4: Nếu DL nằm trong miền bác bỏ giả thuyết H0 thì bác bỏ H0, chấp

nhận H1 và ngược lại.

Như vậy phương pháp này chuyển bài toán KĐ về bài toán quyết định, thực

chất gồm 2 quyết định khác nhau là bác bỏ H0 hay không bác bỏ H0. Hai loại sai

lầm liên quan đến quyết định là bác bỏ H0 đúng và không bác bỏ H0 sai. Lực của

KĐ đo bằng XS bác bỏ H0 khi H0 đúng.

Mô hình của Neyman và Pearson sau đó đã bị Fisher bác bỏ hoàn toàn. Theo

Fisher, không thể có tiêu chuẩn bất biến nào cho mức ý nghĩa, cũng không thể chấp

nhận cách tiếp cận theo bài toán quyết định vì nó làm mất ý nghĩa của KĐ giả

thuyết. Vì thế ông cho rằng cách tiếp cận này tuy phù hợp với những mô hình phức

tạp cũng như cho thấy đánh giá tối ưu cho miền giá trị chấp nhận được, nhưng

phương pháp không đúng thì kết quả không đáng tin cậy.

Sự tranh cãi gay gắt về các quan điểm đối lập giữa các tác giả và những người

ủng hộ đã kéo dài nhiều thập kỷ sau đó. Trên các tạp chí y học, xu hướng trình bày

kết quả định lượng thường không thống nhất, dùng khoảng tin cậy hay dùng giá trị

p. Kết quả được phân loại thành có ý nghĩa TK và không có ý nghĩa TK, tùy theo p

dưới ngưỡng hay quá ngưỡng 0,05. Tuy nhiên có ý nghĩa TK và có ý nghĩa lâm

sàng không đồng nghĩa với nhau, có khi không ăn nhập gì nhau. Thêm nữa, không

có ước lượng giá trị tham số, cũng không có đánh giá sai lầm loại II gây nên tình

trạng bất cập, khi những kết quả có ý nghĩa lâm sàng bị bỏ qua chỉ vì cỡ mẫu nhỏ và

bị coi là không có ý nghĩa TK. Ngoài ra, khoảng tin cậy 95% ngầm nói đến ngưỡng

0,05, vì vậy rất nhiều hiểu lầm trong thực hành và giảng dạy kéo dài nhiều năm

bỗng trở thành tiêu chuẩn chân lý được chấp nhận không bàn cãi.

90

Năm 1950, lý thuyết quyết định của Wald và tiếp cận XS chủ quan Bayesian

do Savage và de Finetti được công bố, chiều hướng tranh luận trở nên không tập

trung mà phức tạp hơn với nhiều quan điểm trái chiều đan xen phức tạp. Năm 1989,

một lý thuyết lai giữa hai mô hình KĐ chính thức được đề xuất. (Gigerenzer,

Swijtnik, Porter, Beatty, Kruger, Daston, 1989).

3.1.2. Mô hình kiểm định giả thuyết thống kê được sử dụng trong y học hiện nay

Ngày nay các nghiên cứu khoa học được thực hiện bằng phương pháp KĐ giả

thuyết TK đã sử dụng kết hợp giữa mô hình KĐ ý nghĩa của Fisher và mô hình KĐ

giả thuyết của Neyman và Pearson. Trong các nghiên cứu y học, người ta thường sử

dụng mô hình thử nghiệm lâm sàng đối chứng ngẫu nhiên, về bản chất là sự dung

hòa về mặt phương pháp của hai trường phái trên. Đây là mô hình được xếp vào

hạng có ý nghĩa nhất trong các mô hình nghiên cứu y học.

(Nguyễn Văn Tuấn, 2011c)

Mô hình này được tiến hành như sau:

Bước 1: Đặt giả thuyết không H0 và giả thuyết chính H1.

Bước 2: Tính cỡ mẫu theo mức ý nghĩa α và β mong muốn. Mức ý nghĩa này

cũng cho phép tìm được giá trị ngưỡng. Giá trị đó là cơ sở để đưa ra miền chấp

nhận (và miền bác bỏ) giả thuyết H0.

Bước 3: Thu thập DL D liên quan đến giả thuyết.

Bước 4: Tính giá trị TK: tính u khi kích thước mẫu đủ lớn (phân phối đã được

0).

xem là chuẩn theo định lý giới hạn trung tâm), tính t khi DL có phân phối Student hoặc F khi so sánh hai phương sai (phân phối Fisher),… và tính XS p = P(D/H

Bước 5: Kết luận: Chấp nhận H0 khi p > 0,05 hoặc bác bỏ H0 khi p < 0,05.

Ở bước 4, các tính toán trong mọi trường hợp đều đòi hỏi tính chuẩn của DL.

Nếu điều kiện PPC không thỏa mãn thì kết luận có thể không chính xác. Chính vì

thế, trước khi thực hiện bước 4 người ta phải kiểm tra tính chuẩn của DL. Nhưng

điều đó không được nói rõ trong mô hình năm bước trên.

Hiện nay giảng dạy KĐ giả thuyết TK gặp nhiều khó khăn, nguyên nhân xuất

phát từ sự xung đột giữa hai quan điểm KĐ giả thuyết khoa học theo Fisher hay

91

Neyman-Pearson. Trong các giáo trình TK y học vẫn trình bày theo tiếp cận bài

toán quyết định và sự phân loại có ý nghĩa/không có ý nghĩa, trong khi đó các tạp

chí chuyên môn y học không còn trình bày theo tiếp cận Neyman-Pearson nữa. Kỹ

năng trình bày kết quả định lượng theo khoảng tin cậy và giá trị p đang phổ biến,

cốt lõi lý luận của những kỹ năng này nằm ở những kiến thức về PPC. Vì vậy chúng

tôi tiến hành phân tích các đặc trưng tri thức luận của PPC trong bài toán KĐ giả

thuyết TK.

3.2. PHÂN TÍCH TRI THỨC LUẬN VỀ PHÂN PHỐI CHUẨN

Luật PPC là một phần quan trọng của lí thuyết XS và ứng dụng TK. Có thể

nói, nếu không có PPC thì không có phép KĐ TK, cũng không có cả phân tích TK.

Vai trò của luật PPC đã được chứng minh và khẳng định giá trị qua nhiều thế hệ

nghiên cứu học thuật, lịch sử phát triển của khái niệm PPC gắn liền với rất nhiều

thành tựu quan trọng trong nhiều lĩnh vực toán học, đặc biệt là giai đoạn toán học

hiện đại.

PPC không chỉ là một công cụ toán học hay chỉ có giá trị biểu tượng, mà là

một quy luật vận hành của giới tự nhiên và xã hội đã được nhận thức và kiểm

chứng. Theo đó, nguyên nhân tính phổ biến rộng rãi của PPC đã được giải thích.

Theo Borel, PPC là quy luật của hiện tượng ngẫu nhiên, trong đó nhiều nguyên

nhân tác động mà không nguyên nhân nào là quyết định. Theo Liapunov (1954), đại

lượng ngẫu nhiên là tổng một số lớn các đại lượng ngẫu nhiên độc lập và phương

sai rất bé so với phương sai của tổng. Trong thực tiễn, mỗi đại lượng ngẫu nhiên

được sinh ra bởi vô số nguyên nhân, trong đó không nguyên nhân nào chiếm ưu thế

so với các nguyên nhân còn lại, nên phương sai của mỗi nguyên nhân là rất nhỏ

không so sánh được với phương sai của đại lượng được xét. Do đó phần lớn các đại

lượng ngẫu nhiên trong thực hành có PPC.

Trong phần dưới, chúng tôi trình bày những kết quả rút ra từ quá trình hình

thành và phát triển của luật PPC, trên cơ sở đó làm rõ những đặc trưng tri thức luận

cơ bản. Những đặc trưng này sẽ phải tính đến trong DH KĐ giả thuyết TK – đối

tượng nghiên cứu của hai chương tiếp theo.

92

Ở đây chúng tôi tìm câu trả lời cho những câu hỏi sau về PPC:

- Điều kiện nảy sinh và những đặc trưng cơ bản của khái niệm PPC là gì?

- Khái niệm PPC được hình thành và phát triển qua các giai đoạn nào?

- Bài toán và các đối tượng liên quan gắn với khái niệm PPC là gì?

- Có những cách tiếp cận nào liên quan đến khái niệm PPC? Sự tương đồng và khác

biệt giữa những cách tiếp cận này là gì?

Về giới hạn nghiên cứu, chúng tôi tập trung phân tích các khái niệm dùng

trong phương pháp Thống kê xác suất (probability-based statistical method) và

Thống kê có tham số (parametric statistics) trong khoảng thời gian lịch sử từ năm

1730 đến năm 1920. Đây cũng là những kiến thức cơ bản, mở đầu của học phần

XS-TK được giảng dạy tại ĐHYD Tp HCM.

3.2.1. Lịch sử hình thành khái niệm PPC

Ban đầu PPC xuất hiện chỉ như một công cụ giải tích trợ giúp cho tính toán

XS. Sau một quá trình tích lũy phát triển lâu dài qua nhiều thế hệ các nhà nghiên

cứu PPC mới được công nhận là khái niệm trọng tâm của XS-TK. Luật PPC được

ứng dụng cho nhiều hiện tượng tự nhiên với các đơn vị đo khác nhau và tham số

khác nhau, điều này gây khó khăn khi so sánh biến số. Vì vậy, cần xây dựng luật

phân phối chuẩn tắc độc lập với đơn vị đo. Do PPC được xác định bởi 2 tham số

trung bình và độ lệch chuẩn, nên phân phối chuẩn tắc có trung bình là 0 và độ lệch

chuẩn là 1. Phép biến đổi chuẩn hóa biến ngẫu nhiên chính là hoán chuyển z, cho

2

z

0,5

=

φ

e

z ( )

kết quả là chỉ số z. Một biến ngẫu nhiên Z được gọi là có phân phối chuẩn tắc khi

1 π 2

nó có hàm mật độ XS. . Hàm này hiển nhiên dương, nhưng không

2

z

0,5

=

e

dz

dễ dàng thấy được đó là hàm mật độ XS, vì muốn vậy cần tính được tích

π 2 2

0

. phân

Cuốn sách đầu tiên về lí thuyết XS, The Doctrine of Chances: or a method of

calculating the probability of events in play được viết bởi Abraham de Moivre và

được xuất bản 3 lần vào những năm 1718, 1738 và 1756. Trong đó, khái niệm mật

93

nghiên cứu sâu các hệ số của hạng tử và chỉ ra khi n lớn, hệ số của hạng tử

độ XS chưa được đề cập mà chỉ xoay quanh vấn đề luật của khai triển nhị thức (a+b)n

2 nπ

x

2

m

m

m

m x 

( )b x

 2

( ) b x

trung tâm xấp xỉ . De Moivre chứng minh rằng khi n=2m, với

2 x

2 x

0, 7976 n

1      2

1 2 ( ) 2

2 2 / l

n

2 ( 2 / ) n l 

( b m l

( ) b m e

)  

, thì . Ông cũng chứng minh rằng

2 e np

. Tuy nhiên ông chỉ dừng lại ở các tính toán này

mà không đi xa hơn, về mặt tính toán cũng như phát triển khái niệm TK, ông không

2s để trình bày công thức giống với dạng hiện đại, cũng



xf ( )

1

dùng khái niệm về độ lệch



không đánh giá giới hạn chuỗi tổng của dãy b(m+l) để chứng minh .

2 p

cũng do Stirling tính toán. Ngay cả giá trị chính xác của hằng số

Như vậy đây là dẫn nhập đầu tiên về PPC như là một giới hạn của dãy phân

phối nhị thức.

Trong cuốn sách, vai trò của định lí giới hạn trung tâm được quan tâm, với

định hướng ứng dụng trong khoa học bảo hiểm, các định nghĩa và kết quả được

trình bày với nhiều tính trực giác và thực nghiệm: “Phân phối xác suất của một số

lần đạt mặt ngửa khi tung một đồng xu 1800 lần”. Nghiên cứu của Moivre chỉ giới

hạn trong các yếu tố cơ bản nhất của lí thuyết XS, chứ chưa đề cập đến các vấn đề

phương pháp của TK, ngay cả các ứng dụng cũng chỉ trong vấn đề về tính may rủi

và thăng giáng của các hiện tượng. Đáng chú ý là đóng góp của ông nhằm xây dựng

công cụ tính toán gần đúng khi tham số lớn, ông chỉ nhằm xây dựng phép xấp xỉ

chuẩn tắc cho nhị thức Newton, đường cong chuẩn tắc chỉ đóng vai trò công cụ tính

toán nhằm trình bày một xấp xỉ liên tục cho một đối tượng toán học rời rạc, chứ

không phải là đường cong liên tục mật độ XS. Đây là phương pháp hàm sinh

(generating function), được sử dụng xuyên suốt tác phẩm. Ông cũng chỉ ra sự quan

trọng của cỡ mẫu n, chỉ ra độ lệch từ trung tâm phụ thuộc vào n. Ông cũng chỉ ra

bản chất của luật PPC, khi XS của biến cố là 0.5, PPC là luật phân phối giới hạn của

94

số lần xảy ra biến cố khi số các phép thử tăng lên vô hạn. Tuy nhiên, ông không đi

xa hơn, để tiến đến luật số lớn và định lí giới hạn trung tâm. Những thành quả này

cần nhiều năm sau do một nhà cơ học triết học và toán học người Pháp khác khám

phá. Thời kì của Moivre gắn liền với lí thuyết XS cổ điển, TK học chưa có sự phát

triển về phương pháp riêng và nền tảng toán học mà chủ yếu tập trung vào mô tả.

TK suy luận phải đợi một thời gian sau, với các công trình của Laplace và Gauss.

Hai hướng nghiên cứu phát triển tuy khác nhau nhưng cùng tạo nên nền tảng của

TK suy luận, hai nhà toán học này cũng là những nhà triết học, cơ học và thiên văn

học xuất sắc.

Các nghiên cứu liên quan đến PPC được định hình từ hai nguồn, nguồn thứ

nhất tiếp nối các công trình của Moivre đưa ra các tính toán chuẩn hóa tham số và

suy luận về tham số của nhị thức Newton, nguồn thứ hai xuất phát từ bài toán

ngược trong cơ học nhằm suy đoán ước lượng hệ số của mô hình tuyến tính, gọi là

phương pháp bình phương tối thiểu.

Vào năm 1774, Laplace đưa ra tính toán chặt chẽ đầu tiên đánh giá tích phân

trên, trong bài viết Mémoire sur la probabilité des causes par les événements. Các

(

p

1)

3 )

(

p

E

dz 2 .exp(

zz

)

tính toán tích phân phức tạp được trích dẫn,

  q p 1)...( q 1.2.3...

(

p

p q p q  q

 p q )

 q 2 pq

p

3 )

(

3 )

q

zz

 

dz 2 .exp(

)

ln

zz

m

.

2 

p

d 

m

 q pq 2

pq 2 q )

(

m ln

(   p 2 pq

m lấy giá trị từ 0 đến 1 và giả sử tích phân bắt đầu từ 1, ta cần giá trị của nó tại 0.

Đặt , ta có . Số

 n i

n m m d

m

d

Giả sử tích phân đi từ 0 đến 1, ta có

2

i

m 2

i

ln

ln

m d 

p 2 i

2 i

m

2 i

m

m d 

(1

m

)

1

m

p

2

3 )

(

p

p

dz 2 .exp(

zz

)

,

dm  ln

m

 q 2 pq

pq 3 2

q

p

)

(

21 x 2

e

dx

suy ra . Do đó, dẫn đến E=1.

p 2

0

Từ kết quả trên, với p=q=1/2 và x=2z, ta có .

95

Năm 1782, Laplace với những đóng góp to lớn về lí luận và tính toán đã đưa

ra khái niệm hàm mật độ XS và chuẩn hóa các tham số của PPC. Công lao của

Laplace là nêu lên vai trò trung tâm của luật PPC, đóng góp nhiều xây dựng về lí

thuyết cho khái niệm PPC. Ông đã chỉ ra cách lập luận dựa vào XS để suy luận về

tham số p, không những thế, ông đã mở rộng phương pháp suy luận tổng quát hóa

kết quả cho rất nhiều các phân phối XS.

Năm 1812, Laplace hoàn tất công trình Théorie analytique des probabilités,

trong đó trình bày các kết quả căn bản với hình thức toán học chặt chẽ và toàn bộ lí

thuyết sai số. Đó là một nền tảng vững để khẳng định vai trò của PPC. Nền tảng lí

thuyết của PPC được khẳng định qua định lí giới hạn trung tâm, do Laplace phát

biểu và chứng minh. Qua đó, PPC được dùng để xấp xỉ và ước lượng các phân phối

của tổng và trung bình của bất kì biến ngẫu nhiên của bất kì phân phối nào.

Vào năm 1819, ông đã phát triển định luật Laplace, sau này gọi là định lí giới

hạn trung tâm, nhấn mạnh vai trò quan trọng về mặt lí luận của PPC. Theo định lí

này, phân phối của tổng các biến ngẫu nhiên xấp xỉ về PPC khi số biến ngẫu nhiên

lớn. Định lý chỉ ra tính khách quan của PPC như một luật tự nhiên, phù hợp với

quan sát thực nghiệm và được chứng minh toán học. Ông cũng trình bày cách tính

tích phân Laplace, tìm ra hằng số chuẩn hóa của PPC, đưa một lớp các PPC đa dạng

về một phân phối chuẩn tắc thuận tiện cho tính toán thực nghiệm. Tuy nhiên, ông

không nói về PPC như một luật khách quan mà chỉ là một giới hạn của các hiện

tượng, theo đó, một biến ngẫu nhiên gồm nhiều tác động, mỗi tác động độc lập,

đóng góp như nhau thì sẽ xấp xỉ PPC. Thời kỳ của Laplace, các phương pháp của

TK học được phát triển mạnh dựa vào nền tảng lý thuyết XS gắn với các công trình

vật lý. Laplace cũng là một nhà cơ học vĩ đại, tư tưởng tất định luận gắn liền thời kỳ

này với tên tuổi của ông. Laplace tin rằng vũ trụ vốn theo quy luật tiến hóa có trật tự

nghiêm ngặt nhưng cũng rất phức tạp bao gồm sự vật hiện tượng tương tác chồng

chéo nhau mà sinh ra sự mập mờ thăng giáng vô trật tự, ông cũng lý giải cách thức

vũ trụ tiến hóa tạo ra thế giới mà không chấp nhận Thượng Đế. Khi hoàng đế

Napoleon hỏi ông đặt Thượng Đế ở đâu trong hệ thống, ông đã trả lời: Thưa hoàng

96

đế, tôi không cần giả thuyết ấy. Cách tư duy này gắn liền với các thành quả khoa

học kỹ thuật rực rỡ thời đó, trong đó phương pháp thực nghiệm đạt thành công kỳ

diệu.

Thời kỳ này cơ học nói chung và cơ học thiên thể rất phát triển, bài toán trung

tâm là tổng hợp thông tin từ những số liệu quan sát và thực nghiệm, các nhà khoa

học đã thành lập được các mô hình tuyến tính, nhưng rất lúng túng trong việc xử lý.

Ngay cả nhà toán học vĩ đại Euler, người được mệnh danh là hiện thân của giải tích

cũng từng đầu hàng trước bài toán này. Sự phức tạp nằm ở chỗ, các quan sát sẽ càng

chính xác khi số lần quan sát tăng lên, cũng đưa đến việc số phương trình tuyến tính

liên kết với các quan sát cũng tăng lên, mặt khác các mô hình tuyến tính tuy dễ

thành lập và tiện hiệu chỉnh sai số nhưng lại gây khó khăn khi có kích cỡ lớn. Các

bài toán này liên quan chủ yếu đến xác định vị trí, quỹ đạo của các hành tinh trong

hệ Mặt trời và thiên thể khác. Thành quả thời kỳ Phục Hưng của định luật Kepler

không dựa trên phân tích TK cũng không dựa trên mô hình tuyến tính, mà dựa vào

số liệu quan trắc mà Kepler đề xuất mô hình. Ông không hề KĐ tính tin cậy hay sự

trùng khít của mô hình quỹ đạo thiên thể theo logic TK, mà chỉ xác nhận mô hình lý

thuyết giải thích tốt số liệu quan trắc.

2

x

f x ( )

e−=

Laplace đã mở rộng kết quả của Moivre cho trường hợp phi đối xứng, khi XS

của biến cố không là 0.5. Hàm Gauss đã được soi rọi vai trò, ý nghĩa

trong bước tiến gắn với tên tuổi của Laplace. Thời kì Laplace nở rộ các phương

pháp tính toán giải tích và khai sinh các hàm quan trọng trong XS-TK, như hàm

2

x

,

x

2

 Γ  

  

=

f x er ( )

− t e dt

= − 1

2 π

1 2 π

−∞

sai số:

= Φ − Φ −

= Φ −

f er

n ( )

(

n

)

n 2 ( ) 1

n 2

  

  

với ứng dụng lớn:

97

+∞

2

= −

=

fc x

− t e dt

er

f x ( ) 1 er ( )

2 π

x

x

ω

x ( )

−= e

er

fc

− ( ix)

2

+∞

=

= − Φ =

1

( ) Q x

− 1 er f

( ) x

t − 2 e dt

1 2

x 2

1 π 2

  

  

  

  

x

Các định lí giới hạn chỉ nêu lên mặt định lượng của luật số lớn, theo đó trung

bình kết quả quan sát một số lớn các thử nghiệm độc lập trên cùng một đại lượng

ngẫu nhiên có xu hướng hội tụ về giá trị kì vọng và mất dần tính ngẫu nhiên. Các

định lí này quá đặc biệt nên không giải thích được nguyên nhân tính phổ biến của

PPC, cũng không chỉ ra được điều kiện nào là cơ sở để xây dựng PPC. Những hạn

chế này phải đợi hơn một thế kỉ sau mới được Liapunov (1954) giải quyết và

Bernshtein (1946) mở rộng cho vector ngẫu nhiên.

Như vậy, Moivre là người đầu tiên đề cập đến PPC, tuy nhiên ông không hề

quan tâm đến việc nghiên cứu sâu hơn mà chỉ dừng lại ở chỗ đề ra một luật xấp xỉ

cho hệ số của khai triển nhị thức Newton. Mặc dù ý định của ông là xây dựng một

học thuyết về tính ngẫu nhiên và sử dụng đại số tổ hợp kết hợp giải tích, nhưng ông

không đi xa hơn trong việc xem xét luật xấp xỉ ấy là một luật về tính ngẫu nhiên.

Điều này có thể do ông ý thức được về tính bất định là rất phổ biến, trong khi học

thuyết của ông chỉ quan tâm giải quyết một lớp rất nhỏ các vấn đề ngẫu nhiên đo

đạc được, cũng có thể do quan điểm thực chứng khiến ông không quan tâm đến việc

đề ra những khái niệm mới mà chỉ coi là những công cụ phục vụ cho một học

thuyết, xây dựng xong học thuyết thì các công cụ tạm bợ cũng sẽ chấm dứt vai trò

lịch sử.

Năm 1809, Gauss công bố độc lập các kết quả tính toán trong tác phẩm lí

thuyết về chuyển động của các thiên thể theo quỹ đạo conic. Trong đó, nhiều kết

quả quan trọng như: phương pháp bình phương tối thiểu, phương pháp hợp lí cực

đại và PPC. Gauss không phát minh ra phương pháp bình phương tối thiểu, nhưng

đã chỉ ra phương pháp tương đương với phương pháp bình phương tối thiểu. Ông

chỉ ra rằng, sử dụng phân phối các sai số của hệ số tuyến tính theo đường cong hình

98

chuông úp và cực đại hóa tính hợp lí thông qua cực đại hóa phân phối hậu nghiệm

của sai số là cách làm tương đương với sử dụng phương pháp bình phương tối thiểu.

Kết quả này phù hợp với nhận định của Laplace vào năm 1810 cho rằng hiệu chỉnh

các sai số đột biến có thể dựa vào định lí giới hạn trung tâm. Hai ông đã tiến đến rất

− ∆∆ hh

ϕ

∆ =

e

gần phương pháp hồi quy tuyến tính, và đã xây dựng nền tảng lí luận toán học chặt

h π

chẽ cho PPC. Theo kí hiệu của Gauss , trong đó ∆ là độ lớn của sai

số, h là độ chính xác của quan sát, ϕ∆ là luật XS của sai số phép đo với độ lớn ∆.

Ông đặt giả thuyết rằng giá trị kì vọng là trung bình số học của các giá trị đo được,

rồi chứng minh luật PPC của sai số là luật phân phối duy nhất hợp lí cho sự chọn

lựa giá trị trung bình như là một đánh giá xấp xỉ cho tham số vị trí. Sử dụng luật

phân phối này như một hình mẫu phổ biến cho sai số thực nghiệm, ông đã xây dựng

phương pháp bình phương tối thiểu phi tuyến gia trọng. Gauss thể hiện phẩm chất

của nhà nghiên cứu khách quan, phát triển hài hòa cả hai phương diện thực nghiệm

đo đạc và nghiên cứu lý thuyết. Ông phát triển PPC nhằm làm rõ cho phương pháp

bình phương tối thiểu, phương pháp này là cơ sở tính toán khoa học nhằm giải

quyết một lớp rất lớn các bài toán ứng dụng. Tuy nhiên, ông cũng để ý đến tính chất

của PPC và đặt giả thuyết về một luật khách quan mà không chứng minh luật này đề

cập đến phân bố tự nhiên của các sai số không hệ thống, ngẫu nhiên và không thể

2

=

=

2 = µ σ 0,

,

f x ( )

− xe π

1 2

loại trừ trong công tác đo đạc. Gauss cũng đưa ra khái niệm PPC với

Độc lập với Gauss, nhà toán học và kỹ sư người Anh Robert Adrain (1775 -

1843) phát minh ra phương pháp bình phương tối thiểu và áp dụng trong các bài

toán hiệu chỉnh đo lường và thủy động học. Năm 1808, Adrain dùng phương pháp

bình phương tối thiểu để chỉnh lí số liệu đo lường. Qua đó, luật PPC của sai số được

thiết lập, tạo ra nền tảng cho phép chứng minh chặt chẽ phương pháp bình phương

tối thiểu, qua đó PPC giúp khẳng định tính giá trị và tính tin cậy của phương pháp

bình phương tối thiểu. Các công trình của Adrain về PPC rất được quan tâm và

99

được Cleveland Abbe, một nhà khí tượng học Mỹ phát minh lại vào năm 1871. Dựa

vào sử dụng PPC, Abbe rất thành công trong công tác dự báo khí tượng thông qua

xử lí số liệu quan trắc. PPC vẫn chưa được nhìn nhận thống nhất như một luật hay

một mô hình có giá trị quy luật của thế giới khách quan, mà vẫn đóng vai trò một

công cụ. Sự hình thành khái niệm khó khăn và lâu dài cũng phản ánh tính đa dạng

và phức hợp và tính cơ bản của luật PPC. Vấn đề cơ bản lúc này không còn là khám

phá tính quy luật của các đại lượng ngẫu nhiên nữa, mà là làm sao giải thích tính

quy luật của các đại lượng ngẫu nhiên. Điều cơ bản là chỉ ra điều kiện cơ sở để xây

dựng PPC về mặt lí thuyết và chỉ ra giới hạn áp dụng giả thuyết PPC trong

ứng dụng.

Các nhà khoa học tin tưởng vào tính quy luật của đại lượng ngẫu nhiên đã

được khám phá, tìm cách mở rộng quy mô ứng dụng và suy rộng các tính chất của

hệ cơ học sang hệ thống xã hội của con người. Do thiếu sót cơ sở xây dựng PPC

dẫn đến sai lầm trong ứng dụng, các nghiên cứu này ban đầu cũng không tránh khỏi

sơ xuất.

Năm 1835, nhà TK xã hội học đầu tiên là Adolphe Quételet, được coi là cha

đẻ của ngành khoa học xã hội định lượng, nêu lên khái niệm con người trung bình,

nhằm nghiên cứu con người ở tầm vĩ mô, trong đó khái niệm PPC được sử dụng

cho rất nhiều phân phối từ các số liệu xã hội học. Quételet thành công ở tầm tiếp

cận vĩ mô nhưng thất bại ở tầm vi mô khi không thể rút ra suy luận cho con người

cá nhân cụ thể. Các chỉ số TK không thể giải thích đầy đủ tính chất được xét, cũng

không nhất thiết tương ứng với thực thể nào đó tồn tại trong tự nhiên và xã hội, con

người trung bình là một khái quát hóa sai lầm. Đặc biệt là thất bại của ông đưa đến

thành công mới cho PPC, khi các nhà vật lí lí thuyết đã sửa chữa sai lầm bằng cách

sử dụng điểm mạnh của các định luật Quételet và giảm thiểu điểm yếu khi áp dụng

mô hình ứng xử của xã hội tự do vào vật lí lí thuyết các khí lí tưởng và phát triển

vật lí TK.

Trong nhân chủng học, nhà di truyền học và khí tượng học Francis Galton

(1888) đã phát minh phương pháp hồi quy tuyến tính và phương pháp hệ số tương

100

quan, ông này cũng sai lầm trong phương pháp luận khi suy rộng kết quả vật lí học

đem áp dụng vào nghiên cứu não tướng học. Tuy rằng suy luận TK dựa vào DL, XS

dựa vào giả thuyết, nhưng kết quả XS được chứng minh là đúng, còn suy luận TK

có thể sai nên không có sự thật tuyệt đối mà chỉ đề cập đến mức ý nghĩa. Sự sai lầm

do pha trộn lẫn giữa yếu tố thiếu sót về giả thuyết XS và mức có ý nghĩa TK bắt

nguồn từ sự thiếu sót cơ sở của PPC. Thiếu sót này là về tri thức luận chứ không về

toán học, các kết quả toán học được sử dụng đều phải được chứng minh. Galton để

lại nhiều đóng góp có ý nghĩa, mô hình Quincunx vẫn được dùng trong DH XS-TK,

đặc biệt là các thuật ngữ chuyên môn TK y sinh học mang đậm dấu ấn của ông.

Các tư tưởng cách mạng trong vật lí TK được dấy lên qua đột phá của

Bolzman và Maxwell. Năm 1860, Maxwell nêu lên luật phân phối Maxwell: “Khi

2

N

− x 2 dxα

e

1 π 2

tổng số hạt là N thì số các hạt chuyển động phân bố theo một hướng, nằm giữa x và

x + dx, là .

Nghiên cứu của Maxwell khẳng định rằng PPC không chỉ là một công cụ toán

học phổ biến mà còn là một luật chi phối các hiện tượng tự nhiên, đồng thời là mô

hình cho nhiều lớp hiện tượng có thể được mô tả chính xác dựa vào phân phối ấy.

Thông qua định luật số lớn, PPC là một mô hình xấp xỉ đơn giản cho nhiều hiện

tượng phức tạp, và là một giả thuyết áp dụng cho những lớp mô hình ứng dụng khác

có xu hướng tập trung quanh một giá trị trung bình và giảm nhanh đột ngột khi ra xa

giá trị trung bình.

Vào những năm cuối thế kỉ XIX, khái niệm PPC đã hoàn chỉnh và tìm được

ứng dụng rộng lớn. Phương pháp toán học có giá trị sâu sắc lại được thừa kế và phát

triển mạnh, qua đó PPC tìm được vị trí mới và được khẳng định đúng đắn hơn, mỗi

lần lại vững chắc và xuất sắc hơn trước. Sang thế kỉ XX, sau khi khẳng định vai trò

quan trọng và nội dung phong phú, PPC được thống nhất tên gọi. Karl Pearson

(1900), người phát minh ra KĐ chi bình phương cho phân phối theo bảng

contingency, là người đóng lại một thời kì đầy phức tạp và mở ra một thời kì mới

với trật tự. Trước Pearson, các nhà nghiên cứu ở nhiều lĩnh vực khác nhau cùng

101

phát triển phương pháp và kết quả nghiên cứu khoa học trên nhiều hướng đề cập

khác nhau tiến đến một cơ sở cho TK học, trong đó PPC trải qua rất nhiều đấu tranh

và nhiều thử thách trong nhiều lĩnh vực.

Năm 1894, ông đề xuất khái niệm độ lệch chuẩn. Năm 1900, ông phát minh

phương pháp chi bình phương để KĐ tính phù hợp giữa các phân phối. Năm 1920,

ông đề ra tên gọi PPC như ngày nay. Ông cũng là tác giả của các phân tích độ nhọn

của phân phối và họ đường cong Pearson. Cùng với trường phái Pearson, Yule

(1900, 1907) đã đem lại sự thống nhất cho TK phân tích khi tổng hợp được phương

pháp tương quan và hồi quy với phương pháp bình phương tối thiểu và lí thuyết sai

số vào năm 1897. Như vậy, không có gì lạ khi vai trò trung tâm quan trọng hàng

đầu của PPC được chứng minh và sử dụng. Yule cũng là người phát minh ra khái

2 µ σ= 0,

1

niệm tương quan bội và tương quan từng phần, trong đó PPC nhiều chiều là công cụ

= , được Hoel

không thể thiếu. Tên gọi “phân phối chuẩn tắc” cho PPC có

chỉ định vào năm 1947.

Những năm 1920 là thời kì then chốt cho TK học dựa trên lí thuyết XS. Đây

cũng là thời kì kinh tế tư bản chủ nghĩa phát triển, cùng với nó là sự thay đổi mạnh

mẽ về tư tưởng. Trong giai đoạn này, tư tưởng kinh tế học mới do John Maynard

Keynes (1921) đề xuất dựa trên xây dựng khái niệm XS dựa vào niềm tin và liên kết

với hành vi của cá nhân thực thể kinh tế đã đem lại hình ảnh mới cho PPC, với vai

trò là tiếng ồn hay tác động tổng hợp của các nhân tố trong hệ thống phức hợp tạo ra

sự giao thoa tác động và tính bất định. Nhà TK vĩ đại nhất thế kỉ Ronald Fisher

(1974), đồng thời là nhà di truyền học, đã thay đổi lịch sử, đem lại bước ngoặt phát

triển cho ngành phân tích TK. Phương pháp KĐ ý nghĩa TK của Fisher kết hợp với

KĐ giả thuyết TK của Pearson là mô hình cơ sở của nghiên cứu lâm sàng.

Câu chuyện về PPC đã và đang tiếp diễn sẽ còn tiếp tục, khái niệm PPC ngày

càng tìm thêm ứng dụng sâu sắc hơn. Trong những năm 50, lí thuyết của quá trình

ngẫu nhiên phát triển mạnh, PPC được sử dụng lại và phát triển mở rộng dưới nhiều

tên gọi khác nhau mô tả những quá trình ngẫu nhiên: PPC nhiều chiều, quá trình

Gauss, chuyển động Brown, v.v. Nhiều ứng dụng sâu vào các chuyên ngành hẹp

102

của toán học như lí thuyết số được triển khai cũng dựa trên PPC. Sự thống nhất này

là tất yếu của một quá trình mở rộng, phát triển mạnh mẽ khái niệm PPC.

3.2.2. Các giai đoạn nảy sinh và phát triển

Theo Thomas Kuhn, trong mỗi giai đoạn phát triển của khoa học, kiến thức

được tổ chức theo khuôn mẫu khoa học, đó là bộ khung của những quan điểm được

công nhận về đối tượng được nghiên cứu. Tiến trình phát triển của khoa học có

những giai đoạn đan xen của sự phát triển tích lũy dần dần và nhảy vọt cách mạng,

tại những điểm nhảy vọt là những công trình khám phá có tính cách mạng thay đổi

khuôn mẫu cũ tạo nên bước ngoặt phát triển, tại đó bắt đầu những bước đột phá

tư tưởng.

Trong trường hợp riêng của lịch sử hình thành phát triển khái niệm PPC,

chúng tôi nhận thấy có những giai đoạn nhảy vọt mang tính cách mạng. Sự nhảy vọt

thứ nhất diễn ra với Gauss và Laplace, tạo ra tiền đề cơ sở toán học cho khái niệm,

đây chính là sự khai sinh của khái niệm. Sự khai sinh khái niệm về mặt toán học

này gắn liền với bước nhảy vọt về đối tượng phương pháp từ lí thuyết XS sang lí

thuyết TK. Sự nhảy vọt thứ hai diễn ra với Pearson, khái niệm được chuẩn hóa với

tên gọi hiện đại, kiến thức được tổ chức theo chuẩn mực của một khoa học TK độc

lập với các ngành khác, đây là sự khai sinh lần thứ hai của khái niệm, song hành với

sự khai sinh ngành khoa học nó được vinh dự phục vụ, phân tích TK có cơ sở vững

vàng, tách khỏi TK mô tả. Vì vậy ở đây sự phân chia các giai đoạn hình thành và

phát triển khái niệm phụ thuộc vào quan điểm của nhà nghiên cứu, khi nhìn PPC

như khái niệm thuần túy toán học được phát triển trong tiến hóa các ngành toán học,

hay là một khái niệm TK học được gieo mầm và lớn lên trong liên ngành phức hợp

toán học, cơ học, xã hội học, v.v để khai sinh như khái niệm trung tâm của

XS-TK học.

3.2.2.1. Giai đoạn những năm 1730 đến 1770

Trong giai đoạn này, PPC mới được phát hiện và mang tính công cụ. TK ứng

dụng giai đoạn này cũng thô sơ, chủ yếu là các vấn đề dân số và nhân khẩu. Vì vậy

PPC được đề cập đến trong các kĩ thuật tính toán, chưa có dáng vẻ một vấn đề toán

103

học, không được coi là đối tượng để phát triển nghiên cứu, cũng không được đặt

tên. PPC xuất hiện dưới hình thức công cụ tính toán đại số, chưa thật sự là một đối

tượng toán học được hình thành bằng phương pháp giải tích toán học. Về mặt khái

niệm, PPC chỉ được xem như một luật hàm sinh xấp xỉ liên tục các hệ số nhị thức

Newton rời rạc, do đó phụ thuộc rất nhiều vào ý thích của các nhà nghiên cứu, chưa

được xem như một công cụ toán học trợ giúp cho các nghiên cứu ứng dụng và các

tính toán khoa học. Vì chưa phải là một đối tượng toán học, PPC chưa được nghiên

cứu sâu về toán học, thêm nữa mối liên quan của PPC với định lí giới hạn trung tâm

và phương pháp bình phương tối thiểu chưa được xác định rõ ràng. Phương pháp

bình phương tối thiểu cũng mới ra đời, chưa được khẳng định là phương pháp chủ

chốt của tính toán khoa học và các ngành khoa học ứng dụng. Định lí giới hạn trung

tâm cũng được chứng minh dựa vào ý tưởng khai thác phương pháp này và mở rộng

cho các bài toán cơ học.

3.2.2.2. Giai đoạn những năm 1780 đến 1860

Khoa học thực nghiệm phát triển mạnh, các nhu cầu đo lường và xử lí số liệu

cũng tăng lên. Giải tích toán học là môi trường tồn tại và phương pháp khai thác sức

mạnh ứng dụng của PPC. Bên cạnh việc phục vụ tính toán xấp xỉ, PPC có vai trò

kép, vừa là một phân phối của kết quả quan trắc vừa là một phân phối dùng làm

chuẩn để so sánh kết quả. Trong giai đoạn này, PPC đã qua tích lũy mà được sử

dụng rộng rãi, có nhiều đóng góp quan trọng trong nhiều lĩnh vực tính toán khoa

học như lí thuyết đo lường, vật lí thiên thể, khí động học. Về mặt lí thuyết, PPC

được sử dụng trong phép chứng minh chặt chẽ và là một công cụ tính toán trợ giúp

cho phương pháp bình phương tối thiểu và lí thuyết đo lường hiệu chỉnh sai số. Vị

trí trong toán học như một phân phối XS liên tục cơ bản nhất được chứng minh nhờ

định lí giới hạn trung tâm, theo đó trong những điều kiện nhất định, tổng các biến

ngẫu nhiên có trung bình và độ lệch chuẩn hữu hạn tiến đến tiệm cận PPC khi số

biến tăng.

Phương pháp bình phương tối thiểu và lí thuyết sai số đạt được vị trí quan

trọng, được sử dụng rộng rãi trong ứng dụng, được chứng minh chặt chẽ về mặt

104

toán học. Đây chính là thời cơ để PPC được xem xét như một đối tượng toán học.

Đây cũng là thời kì này nảy sinh nhiều vấn đề xung quanh PPC. Lí thuyết tương

quan và hồi quy là một mảng phát triển rất mạnh và giàu tính ứng dụng thực tiễn

cũng như ý nghĩa phương pháp luận khoa học, được phát triển đã khẳng định vai trò

trung tâm của PPC. Trong giai đoạn này PPC được biết đến và khai thác dưới nhiều

khía cạnh, đặt tên theo khía cạnh được khai thác. Các nhà nghiên cứu không thống

nhất ý kiến về khái niệm và biểu diễn công thức của PPC. PPC xuất hiện dưới nhiều

cái tên khác nhau như luật sai số, luật Gauss, luật Laplace, tùy theo mối quan tâm

và lĩnh vực của các chuyên gia.

3.2.2.3. Giai đoạn cuối thế kỉ 18 đến 1920

Khái niệm PPC đã được phát triển trong khung lí thuyết toán học nhất quán và

chặt chẽ, vai trò của PPC được chứng minh qua thực tế ứng dụng. PPC trở thành

công cụ quan trọng được ứng dụng hết sức đa dạng trong nhiều lĩnh vực khoa học,

không những trong nội bộ toán học mà cả các ngành khoa học tự nhiên, xã hội và

con người. Bước phát triển mới liên kết, thống nhất phương pháp hồi quy tương

quan với phương pháp bình phương tối thiểu và lí thuyết sai số đem lại ý nghĩa và

phương pháp phân tích TK hiện đại, qua đó khẳng định vai trò của PPC. TK phân

tích và TK tham số đã khẳng định được vị trí, tạo phân ngành đa dạng trong nội bộ

TK học, tạo tiền đề cho TK phi tham số. Việc không sử dụng giả thuyết PPC không

phải là sự phủ định vai trò của PPC, mà chỉ nêu lên giới hạn của phổ khái niệm.

Điều này hợp quy luật phát triển.

Ngành khoa học TK mới ra đời, ngành toán học cũng được hưởng lợi ích và đang

tích lũy để nhảy vọt với cuộc cách mạng do Kolmogorov khởi xướng vào những

năm 1930.

Tên gọi PPC cũng được quy định thống nhất. Từ đây những dạng mở rộng của PPC

được nghiên cứu và ứng dụng rộng rãi, PPC nhiều chiều liên quan đến tương quan

đa bội và hồi quy đa bội.

105

3.2.3. Phạm vi tác động, bài toán và đối tượng liên quan

3.2.3.1. Phạm vi tác động

PPC có phạm vi tác động rất lớn và trở nên phổ biến trong khoa học tự nhiên,

kĩ thuật và khoa học xã hội nhân văn từ lí thuyết đến ứng dụng.

Luật PPC tỏ ra phù hợp chính xác với nhiều định luật của tự nhiên. Hầu hết

các hiện tượng tự nhiên được mô tả bằng luật PPC hay được chuyển biến mô tả để

tuân theo luật PPC. Luật PPC được xấp xỉ cho nhiều lớp hiện tượng, nhiều áp dụng

định lí giới hạn trung tâm và đánh giá sai số theo giải tích toán trong y sinh học, kĩ

thuật. Luật PPC là nền tảng của các phân tích TK, là mô hình cho nhiều phân phối

XS khác. Các bài toán KĐ TK tham số không thể giải quyết được nếu thiếu giả

thuyết về PPC của quần thể khảo sát.

3.2.3.2. Các bài toán liên quan

Các bài toán liên quan đến PPC được phân chia theo phạm vi tác động.

- Sự hình thành PPC: phân phối nhị thức, luật số lớn, luật giới hạn phân phối, xử lí

sai số đo đạc và bình phương tối thiểu.

- Sự mở rộng PPC: PPC đa chiều với các vector ngẫu nhiên

- Ứng dụng của PPC:

Trong XS-TK, các bài toán liên quan bao gồm: KĐ giả thuyết TK, ước lượng

tham số và thiết kế nghiên cứu.

Trong mô hình toán học: Tiếng ồn trắng, mô hình dân số dưới tác động ngẫu

nhiên của môi trường, mô hình dòng điện dưới tác động ngẫu nhiên trong mạng

điện, mô hình Black - Sholes

Trong toán học thuần túy: Lí thuyết số và tổ hợp, luật phân phối số nguyên tố.

Trong vật lí: Mô hình và lí thuyết khí lí tưởng, mô hình và lí thuyết chuyển

động Brown, lí thuyết đo lường và sai số, v.v.

Trong khoa học xã hội: Thiết kế nghiên cứu, xử lí và phân tích số liệu, ước

lượng tham số, KĐ TK, v.v.

106

3.2.3.3. Các đối tượng có liên quan

Sự hình thành và phát triển của khái niệm PPC có liên quan chặt chẽ đến các

công cụ và phương pháp giải tích toán học, khung khái niệm và lí thuyết của XS và

TK. Các đối tượng toán học được đề cập đến chủ yếu và được phân chia theo hai

loại tri thức, nhằm tổ chức khung tri thức cho việc dạy và học.

- Hàm số: Hàm của tập (biến ngẫu nhiên), hàm của hàm (hàm của biến ngẫu nhiên),

hàm đặc biệt (hàm mật độ XS, hàm tích lũy XS, hàm moment, hàm Gauss), hàm

định nghĩa bằng tích phân (tích phân Gamma, PPC, phân phối Student, phân phối

chi bình phương, phân phối Fisher).

- Không gian và topo: Không gian mẫu, không gian XS, không gian tham số

- Phép tính vi tích phân: Độ đo XS, phép tính tích phân định hạn, phép tính tích

phân mở rộng, tích phân Laplace, tích phân entropy, tin lượng Fisher.

3.3. KẾT LUẬN CHƯƠNG 3

Thông qua phân tích các kết quả nghiên cứu lịch sử toán học, phân tích quá

trình hình thành và phát triển của KĐ giả thuyết TK và PPC, chúng tôi đã chỉ ra một

số đặc trưng tri thức luận cơ bản trong từng thời kì, từ đó xây dựng nên bức tranh

đại cương thống nhất về lịch sử của khái niệm.

Phân tích đó cho thấy, trong lịch sử xây dựng và phát triển, bài toán KĐ giả

thuyết TK đã được tiếp cận theo những mô hình khác nhau. Fisher không đưa ra giả

thuyết H1 (đối thuyết của H0) và theo ông thì không thể nói là bác bỏ hay chấp

nhận H0 mà chỉ có thể kết luận là số liệu có phù hợp với H0 hay không. Đứng ở góc

độ người nghiên cứu toán học – khoa học chỉ thừa nhận những gì được chứng minh

chặt chẽ bằng suy diễn, thì quan niệm này là chuẩn xác về phương pháp luận. Tuy

nhiên nó lại không giải quyết được bài toán KĐ, ở đó người ta cần dựa vào mẫu để

đưa ra một nhận định về tổng thể (với một độ tin cậy nào đó). Mô hình của Neyman

và Pearson dường như quán triệt tinh thần này, khi họ cho rằng cần phải đưa ra một

quyết định, và vấn đề là phải xây dựng quy trình hợp lý có luật bác bỏ/chấp nhận và

có đánh giá khả năng sai lầm của quyết định đã chọn. Tuy nhiên, mô hình của

Neyman và Pearson vẫn không hoàn toàn được cộng đồng các nhà nghiên cứu chấp

107

nhận: họ tranh luận về việc kết quả có đáng tin cậy hay không với phương pháp của

hai ông. Mãi đến cuối thế kỷ 20, một lý thuyết lai giữa hai mô hình KĐ mới chính

thức được đề xuất và ngày nay nó được xem như một mô hình phù hợp trong nghiên

cứu y học.

Phân tích tri thức luận lịch sử cũng đã chỉ ra vai trò của PPC trong XS – TK

nói chung, trong việc giải quyết bài toán KĐ giả thuyết TK nói riêng. Kết quả phân

tích có thể là những yếu tố mà chúng tôi dùng trong thiết kế DH KĐ giả thuyết TK

và PPC.

Phân tích trên còn cho thấy những khó khăn, chướng ngại, thậm chí sai lầm

mà các nhà khoa học đã gặp phải trong quá trình khám phá và sử dụng tri thức này.

Sự sai lầm do pha trộn giữa yếu tố thiếu sót về giả thuyết XS và mức có ý nghĩa TK

bắt nguồn từ thiếu sót cơ sở của PPC. Mặt khác, vì các nhà khoa học tin tưởng vào

tính quy luật của đại lượng ngẫu nhiên đã được khám phá, tìm cách mở rộng quy

mô ứng dụng và suy rộng các tính chất của hệ cơ học sang hệ thống xã hội của con

người như Adolphe Quetele hoặc Francis Galton đã sai lầm trong phương pháp luận

khi suy rộng kết quả vật lý học để áp dụng nghiên cứu não tướng học.

Những sai lầm đã gặp phải khi sử dụng KĐ giả thuyết TK và PPC của các nhà

khoa học có thể lặp lại đối với SV ? Có sự chuyển đổi sư phạm từ tri thức cần dạy

đến tri thức được dạy hay không, … là những câu hỏi mà chúng tôi mong muốn tìm

câu trả lời trong các chương 4 và 5 tiếp theo.

108

CHƯƠNG 4

KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

VÀ PHÂN PHỐI CHUẨN: MỘT NGHIÊN CỨU THỂ CHẾ

Mục đích và phương pháp nghiên cứu

Phân tích tri thức luận về đối tượng tri thức O - KĐ giả thuyết TK và PPC ở

chương 3 cho thấy trong bài toán KĐ về giá trị của một tham số λ nào đó, vấn đề là

chấp nhận hay bác bỏ giả thuyết H0: Điều đó đồng nghĩa với việc bác bỏ hay chấp

nhận đối thuyết HA. Lưu ý rằng đối thuyết HA có ba dạng: λ ≠ λ0, λ > λ0, λ < λ0.

Dạng thứ nhất gọi là giả thuyết hai đuôi, hai dạng còn lại gọi là giả thuyết một đuôi.

Phân tích tri thức luận cũng đã cho thấy tính chuẩn của DL là một điều kiện

quan trọng trong bài toán KĐ. Chính các nhà khoa học cũng đã phạm phải những

sai lầm do thiếu sót về giả thuyết XS và mức có ý nghĩa TK bắt nguồn từ sự thiếu

sót cơ sở của PPC.

Trong chương này chúng tôi thực hiện phân tích các đặc trưng của quan hệ thể

chế đối với đối tượng O. Thể chế mà chúng tôi quan tâm là thể chế DH XS-TK ở

Đại học Y dược Tp HCM. Trong phần dưới, chúng tôi sẽ dùng chữ cái IV để chỉ thể

chế này.

Mục đích của chương hướng đến việc tìm kiếm câu trả lời cho các câu hỏi đã

đặt ra ở cuối chương 3: Liên quan đến tri thức O, SV Đại học Y Dược Tp HCM có

thể gặp phải những sai lầm gì? Những sai lầm này có nguồn gốc từ bản chất tri thức

luận, từ sự chuyển đổi sư phạm hay do hợp đồng DH ?

Để hiểu rõ IV hơn, việc nhìn sang một thể chế khác sẽ rất có ích, vì nó cho

phép ta làm rõ những gì có thể tồn tại nhưng đã không tồn tại trong IV. Phương

pháp nghiên cứu so sánh này đã từng được nhiều luận án sử dụng. Thể chế thứ hai,

ký hiệu bởi chữ cái IF, mà chúng tôi chọn để so sánh là thể chế DH XS-TK ở

trường Đại học Y - Đại học Grenoble, cộng hòa Pháp. Sự lựa chọn này được thực

hiện do chúng tôi là một thành viên nghiên cứu của dự án hợp tác giữa Đại học Y

Dược Tp. HCM và Đại học Grenoble về vấn đề DH XS-TK cho SV ngành y.

109

Một số kết quả điều tra thực tiễn trong khuôn khổ của dự án cho thấy việc

DH XS – TK của IF vẫn chưa đáp ứng được đòi hỏi của thực tiễn: SV thiếu động cơ

học môn XS – TK và chưa đạt được những kỹ năng cần có để thực hiện một nghiên

cứu y học. Kết quả này khiến chúng tôi muốn tìm hiểu thêm một thể chế thứ ba. Với

tư liệu tìm được, chúng tôi chọn đó là thể chế DH XS – TK ở Đại học Y, thuộc Đại

học Nam Illinois (Southern Illinois University), Hoa Kỳ. Chúng tôi gọi thể chế này

là IA.

Như đã nói trong Chương 1, cơ sở quan trọng để chỉ ra các đặc trưng của

quan hệ thể chế là những chỉ thị, văn bản chính thức quy định về chương trình, mục

đích DH và những giáo trình phục vụ cho việc DH.

Ở đây, đối với IV chúng tôi sẽ phân tích giáo trình Xác suất – Thống kê và

cuốn sách bài tập đi kèm, do các tác giả Chu Văn Thọ, Phạm Minh Bửu, Trần Đình

Thanh, Nguyễn Văn Liêng viết (hai trong số ba tác giả là GV toán của Đại học Y

Dược Tp HCM, một tác giả khác là GV – bác sĩ nhưng có bằng cử nhân toán).

Chúng tôi sẽ gọi hai cuốn sách này lần lượt là V1, V2. Đối với IF chúng tôi dựa vào

giáo trình Biostatistique của Bénichou, R. Beusccart, P. Roy, C. Quantin (2009),

được sử dụng ở Đại học Grenoble. Tài liệu cho việc phân tích quan hệ của thể chế

IA với đối tượng O là cuốn Basic & Clinical Biostatistics của Beth Dawson, Robert

G. Trapp (2004). Để thuận tiện trong phân tích, chúng tôi lần lượt ký hiệu hai giáo

trình Biostatistique và Basic & Clinical Biostatistics là F và A.

Khi phân tích quan hệ thể chế, chúng tôi sẽ chỉ ra lý do tồn tại của O, những

kiểu nhiệm vụ nào đã được đưa vào và những kỹ thuật nào liên quan đến O đã được

ưu tiên sử dụng. Điều đó giúp chúng tôi làm rõ những gì mà thể chế mong đợi ở SV

khi họ thao tác trên O.

Theo quan điểm của Thuyết nhân học trong Didactic Toán thì nghiên cứu

quan hệ thể chế sẽ cho phép dự đoán được quan hệ cá nhân của hai thành phần chủ

chốt – GV và SV đối với O: họ nghĩ về O như thế nào, sử dụng O ra sao, có thể

phạm phải những sai lầm gì, ...? Nói cách khác, phân tích đó giúp ta trả lời câu hỏi:

trong DH XS-TK, yếu tố đào tạo nghề đã được tính đến như thế nào bởi IV ?

110

Giới hạn trọng tâm phân tích: Trong khuôn khổ có hạn của luận án, chúng

tôi giới hạn trọng tâm vào KĐ giả thuyết TK về so sánh hai tỷ lệ và so sánh hai

trung bình thực nghiệm độc lập. Lý do thứ nhất là nội dung này chiếm vị trí quan

trọng trong chương KĐ giả thuyết TK. Lý do thứ hai: đây là bài toán thường xuyên

gặp trong các nghiên cứu y học. Lý do thứ ba của sự lựa chọn này liên quan đến ý

đồ xây dựng một đồ án DH, ở đó chúng tôi lấy KĐ giả thuyết TK về so sánh hai

trung bình làm đối tượng nghiên cứu.

A. QUAN HỆ CỦA THỂ CHẾ Iv VỚI O

4.1. XS-TK TRONG CHƯƠNG TRÌNH ĐÀO TẠO NGÀNH Y

4.1.1. XS-TK trong chương trình khung do Bộ Giáo dục và Đào tạo quy định

Trong quyết định ban hành tháng 4 năm 2001 về đào tạo đại cương theo 7

nhóm ngành thuộc ngành Khoa học sức khỏe của Bộ Giáo dục và Đào tạo, tất cả

các nhóm ngành đều có môn học XS - TK với thời lượng ít nhất là 3 đơn vị học

trình (45 tiết). Chương trình khung của Bộ Giáo dục và Đào tạo ban hành năm 2001

đối với ngành đào tạo bác sĩ đa khoa được Bộ Giáo dục và Đào tạo và Bộ Y tế

thống nhất thực hiện ở tất cả các trường/ khoa có đào tạo bác sĩ đa khoa.

- Việc triển khai chi tiết thực hiện chương trình và giám sát chất lượng chuyên môn do

Bộ Y tế chỉ đạo thực hiện.

- Phần nội dung chương trình bắt buộc các trường giảng dạy đủ khối kiến thức đã quy

định trong đó phần XS - TK được gọi tên chung là TK y học với thời lượng 3 đơn vị

học trình (45 tiết).

- Trên cơ sở chương trình khung đã được Bộ Giáo dục và Đào tạo phê duyệt, các

trường sắp xếp chương trình và triển khai thực hiện.

- Môn học này nằm trong phần kiến thức cơ sở của khối ngành.

(Bộ Giáo dục và Đào tạo, 2001)

Về yêu cầu, chương trình nêu rõ:

Năm 2012, Bộ Giáo dục và Đào tạo đưa ra một chương trình khung mới, trong

đó môn XS-TK đổi thành môn XS-TK Y học đối với ngành Y, Toán TK Y dược đối

với ngành Dược. Số đơn vị học trình là 3 cho ngành thứ nhất, 4 cho ngành thứ hai.

111

4.1.2. Chương trình XS-TK ở Đại học Y dược Tp HCM

Hiện nay, Đại học Y dược Tp HCM chưa thực hiện DH theo học chế tín chỉ.

Về XS-TK, chương trình của trường tuân thủ quy định của Bộ Giáo dục và Đào tạo

về số đơn vị học trình cũng như về tên gọi môn học.

XS-TK của Đại học Y dược Tp HCM được giảng dạy ở học kỳ I năm thứ nhất

với các hệ đào tạo như sau:

- Hệ chính quy 6 năm dành cho đào tạo bác sĩ (Đa khoa, Răng hàm mặt, Y học cổ

truyền, Y học dự phòng), Dược sĩ: 45 tiết; Cử nhân (Xét nghiệm, Điều dưỡng, Y tế

công cộng, Kỹ thuật hình ảnh, Kỹ thuật phục hình răng, Vật lý trị liệu, Gây mê hồi

sức, Nữ hộ sinh): 45 tiết

- Hệ Liên thông đào tạo Cử nhân (Xét nghiệm, Điều dưỡng, Y tế công cộng, Kỹ

thuật hình ảnh, Kỹ thuật phục hình răng, Vật lý trị liệu, Gây mê hồi sức, Nữ hộ

sinh), Dược: 45 tiết; Y học cổ truyền: 30 tiết.

Từ năm 2011 trở về trước, trước khi học học phần XS-TK ở học kỳ II năm thứ

nhất, SV đã được học học phần toán cao cấp ở học kỳ I. Học phần toán cao cấp

trang bị cho SV những kiến thức cơ bản về vi tích phân và những ứng dụng của

khối kiến thức này trong Y học. Đặc biệt, các kiến thức này hỗ trợ hầu hết các

chứng minh, suy diễn trong XS-TK nên nó được coi là học phần tiên quyết đối với

học phần XS-TK. Tuy nhiên, từ năm học 2011 - 2012, đã có những thay đổi sau:

- Học phần toán cao cấp đã được cắt bỏ, vì thế SV phải tự trang bị kiến thức nền

tảng về giải tích, GV không thể cung cấp những kiến thức liên quan đến giải tích

được sử dụng trong học phần XS-TK do thời lượng có hạn của chương trình.

- Tên học phần “Xác suất thống kê” được đổi thành “Toán xác suất và thống kê

y học”

Chương trình XS-TK (45 tiết) được Bộ môn Toán – Khoa Khoa học Cơ bản

Đại học Y dược Tp.HCM phân bổ cụ thể trong Bảng 4.1

112

Bảng 4.1. Phân phối chương trình XS-TK

[Nguồn: Bộ môn Toán, 2011]

Chương trình trên được cấu tạo thành ba phần: 5 chương đầu dành cho phần

XS, 5 chương tiếp theo trình bày các kiến thức của TK, chương cuối cùng tập trung

bàn về một số ứng dụng cơ bản của XS trong chẩn đoán.

Với chương trình đó, PPC và những ứng dụng của phân phối này trong XS,

ước lượng khoảng tin cậy và KĐ giả thuyết TK được giảng dạy trong 21 tiết bao

gồm những nội dung sau:

- Các phân phối XS thường dùng

- Ước lượng khoảng tin cậy: Ước lượng khoảng tin cậy cho trung bình, cho tỷ lệ

- KĐ giả thuyết TK: So sánh hai trung bình, so sánh hai tỷ lệ

Ở nội dung thứ nhất, thời lượng chủ yếu dành cho PPC với 3/5 tiết, còn lại là

các phân phối khác. Mục đích và yêu cầu về PPC đối với SV: “hiểu bản chất của

PPC và các ứng dụng của nó. Biết cách vận dụng PPC và xấp xỉ các phân phối rời

rạc thông dụng.” (Bộ môn Toán, 2011)

Ở nội dung thứ hai, ước lượng tham số của biến ngẫu nhiên có hai nội dung

chính là ước lượng điểm và ước lượng khoảng tin cậy. Trong đó, ước lượng khoảng

tin cậy chiếm 4 trong tổng số 5 tiết của phần lý thuyết ước lượng. Mục đích, yêu

cầu của chương trình phần ước lượng là “Phân biệt hai phương pháp ước lượng

điểm và ước lượng khoảng tin cậy, nắm vững các phương pháp ước lượng tham số

từ dữ liệu mẫu trong các trường hợp ước lượng khoảng tin cậy”. (Bộ môn Toán, 2011)

113

Với mục đích và yêu cầu như vậy cùng với số tiết được phân bổ của chương

trình, trong phần lý thuyết ước lượng, thể chế IV chỉ ưu tiên phần ước lượng khoảng

tin cậy. Điều này cũng thể hiện rõ trong giáo trình V1 ở chỗ tất cả các bài tập ước

lượng đều là ước lượng khoảng tin cậy.

Trong phần này, định lý giới hạn trung tâm có vai trò giải thích cho các biến

ngẫu nhiên có phân phối chuẩn tắc.

Ở nội dung thứ ba với 12 tiết, KĐ giả thuyết TK chiếm thời lượng lớn nhất về

số tiết so với các phần khác của chương trình. Các khái niệm cơ bản như giả thuyết

"không", các loại sai lầm trong KĐ, miền bác bỏ và miền chấp nhận giả thuyết đều

được nói đến ngay trong phần mở đầu chương. Liên quan đến PPC có hai nội dung

chủ yếu: So sánh hai trung bình và so sánh hai tỷ lệ. Trong phần KĐ giả thuyết TK,

một lần nữa định lý giới hạn trung tâm có vai trò quan trọng trong việc giải thích

các biến ngẫu nhiên có phân phối chuẩn tắc.

- Hiểu được các ứng dụng liên quan đến XS-TK khi học các môn chuyên ngành.

- Áp dụng được XS-TK để xử lý một số bài toán chuyên ngành

- Mở rộng kiến thức về XS-TK để xử lý một số bài toán chuyên ngành trong nghiên

cứu. (Bộ môn Toán, 2011)

Về mục đích yêu cầu của môn học, chương trình nói rõ:

Như vậy, theo sự phân bổ của chương trình thì PPC và KĐ giả thuyết TK có

vai trò quan trọng. Điều này không chỉ thể hiện ở số tiết được dạy mà còn thể hiện

thông qua những nội dung được đề cập.

Yếu tố đào tạo nghề cũng đã được tính đến trong chương trình, đó là sự hiện

diện của phần lớn các bài toán trong thực tế nghề nghiệp thể hiện trong các ví dụ và

bài tập trong V1, V2. Vấn đề này chúng tôi sẽ làm rõ trong phần phân tích tiếp theo.

4.2. PHÂN TÍCH GIÁO TRÌNH V1 VÀ SÁCH BÀI TẬP V2

Như đã nói, V1 là giáo trình "Xác suất Thống kê" và V2 là cuốn bài tập đi

kèm, do Đại học Y Dược Tp HCM xuất bản. Đây là giáo trình được dùng trong

giảng dạy và học tập của IV. Việc tham khảo cuốn bài tập V2 giúp chúng tôi làm rõ

hơn những tổ chức toán học đã được đưa vào V1 và những kỹ thuật mong muốn,

được ưu tiên trong thể chế IV.

114

Với việc phân tích giáo trình, chúng tôi cố gắng làm rõ “cuộc sống” của KĐ

giả thuyết TK và PPC trong IV: chúng xuất hiện qua những kiểu tình huống nào,

những kiểu nhiệm vụ nào đã được đưa vào và những kỹ thuật nào liên quan đã được

ưu tiên sử dụng.

Trọng tâm của phân tích quan hệ thể chế được chúng tôi đặt vào KĐ giả thuyết

TK. Liên quan đến đối tượng này, phân tích ở chương 3 đã chỉ ra điều kiện không

thể bỏ qua là tính chuẩn của DL. Những kiến thức về PPC được trình bày trước hết

trong phần XS với mục đích cung cấp kiến thức cần thiết cho SV khi cần giải quyết

các bài toán của TK, đặc biệt là bài toán KĐ mà chúng tôi quan tâm. Cũng vì thế

nên trước khi xem xét đối tượng KĐ giả thuyết TK trong V1, chúng tôi sẽ phân tích

sự tồn tại của đối tượng tri thức PPC được trình bày trước đó - phần XS.

4.2.1. PPC trong XS

PPC (cũng như các loại phân phối khác) là một khái niệm được đưa vào để

nghiên cứu các đại lượng ngẫu nhiên. Nếu X là một đại lượng ngẫu nhiên có thể

nhận những giá trị thuộc một tập rời rạc và hữu hạn {x1, x2, …, xn} thì người ta

dùng bảng phân phối XS (Bảng 4.2) để nghiên cứu nó. Bảng này có dạng:

Bảng 4.2. Bảng phân phối XS của biến ngẫu nhiên X

0 =

1

  

p i p i

trong đó pi = P[X = xi] và các giá trị pi thỏa mãn điều kiện:

Nếu X là đại lượng ngẫu nhiên liên tục thì người ta không lập bảng phân phối

XS mà sẽ nghiên cứu nó thông qua hàm mật độ XS. Hàm này được định nghĩa là

∀ x

≥ ( ) 0 f x +∞

=

f x dx ( )

1

−∞

    

b

hàm thỏa mãn điều kiện:

≤ P a X b

(

)

f x dx ( )

= ∫

a

Trong trường hợp này ta có công thức:

115

Liên quan đến phân tích của chúng tôi ở dưới còn có khái niệm trung bình,

phương sai, độ lệch chuẩn và hàm phân phối tích lũy của biến ngẫu nhiên X.

Trung bình của biến ngẫu nhiên X, kí hiệu E(X) hay µ, được định nghĩa là:

2

=

=

V

ar(

X

)

E X (

µ )

Phương sai của biến ngẫu nhiên X, ký hiệu σ 2, là đại lượng chỉ mức độ phân

2σσ =

=

tán của DL xung quanh giá trị trung bình, và 2 σ , còn độ lệch

)

)( xF

( XP

x

)( duuf

x ∫= a

chuẩn là . Hàm phân phối tích lũy của X là .

PPC được V1 trình bày trong Chương IV - Các phân phối thường dùng. Ở

đây, các phân phối XS thường dùng được đưa vào là: phân phối Bernoulli, phân

phối nhị thức, phân phối Poisson, PPC, phân phối chi bình phương, phân phối

Student và phân phối Fisher. Trong số các phân phối XS này, PPC thuộc loại phân

phối liên tục. Nó được trình bày chi tiết hơn các phân phối khác cả về phần lý

thuyết cũng như những ứng dụng và các bài tập liên quan (10 trên tổng số 20 bài tập

của chương).

Ta biết rằng các phân phối của biến ngẫu nhiên X được định nghĩa thông qua

hàm mật độ của nó. Chẳng hạn, khái niệm PPC

Cho biến ngẫu nhiên U liên tục, U có phân

phối chuẩn (hay phân phối bình thường

chuẩn), ký hiệu

khi hàm mật

U N ~

(0,1)

2

u 2

=

độ có dạng:

( ) f u

e

1 π 2

Đồ thị f(u) có dạng hình chuông đối xứng qua trục tung. Diện tích giới hạn bởi trục

+∞

=

hoành và đường cong chính là

f u du ( )

1

[V1, tr.59]

−∞

được định nghĩa như sau:

116

Khái niệm PPC được V1 đưa vào theo thứ tự: Hàm mật độ XS, dạng đồ thị và

=

φ

φ

Φ = ( ) u

P U a

(

)

≤ P a U b

(

)

b ( )

a ( )

tính chất của hàm mật độ XS f (u), sau cùng là định nghĩa về hàm tích lũy với chú ý

là và .

Sau khi trình bày định nghĩa về PPC, V1 đưa vào định nghĩa khái niệm phân

Cho biến ngẫu nhiên X liên tục, với

là hai thông số, X có phân phối bình

0,σ µ>

2

thường, ký hiệu

X N µσ khi hàm mật độ có dạng:

~

)

(

,

2

− − µ x ( ) 2 σ 2

=

với x R∈ .

f x ( )

e

1 σ π 2

Khảo sát hàm số

f x ta có đồ thị

( )

f x đối xứng

(C). Đường biểu diễn ( )

qua trục x µ= , cực trị phụ thuộc vào

σ, do đó dạng của (C) tùy thuộc vào

hai thông số µvà σ.

Đặc tính của biến ngẫu nhiên bình thường:

=

=

2 σ

=

+

EX

VarX

µ t

µ ,

,

M t ( )

exp

2 2 σ t 2

  

  

Vậy trong phân phối bình thường tham số µ và σ là trung bình và độ lệch chuẩn

[V1, tr.61-62]

phối bình thường.

Cách trình bày định nghĩa phân phối bình thường như trên cho thấy, phân phối

2

0µ= và phương sai

1σ = .

bình thường chuẩn là trường hợp đặc biệt của phân phối bình thường khi trung bình

Ở đây chúng tôi muốn lưu ý rằng thuật ngữ "Phân phối bình thường" được V1

2 µ σ= 0,

1

= , nhiều sách của Việt

dịch từ “Normal Distribution”, trong khi hầu hết các sách về XS - TK của Việt Nam

đều dịch từ này là PPC. Trường hợp đặc biệt, khi

Nam gọi là "Phân phối chuẩn tắc", thì V1 gọi là PPC. Trong luận án này, chúng tôi

dùng từ PPC theo nghĩa Normal distribution.

Phân phối chuẩn tắc có hàm mật độ đơn giản hơn PPC nên các tính toán cũng

dễ thực hiện hơn, vì thế người ta thường sử dụng các định lý sau để đưa một biến có

117

PPC hoặc phân phối nhị thức về phân phối chuẩn tắc. Các định lý này được phát

biểu tường minh trong V1:

Chuẩn hóa phân phối bình thường

Các mệnh đề sau đây giúp ta đưa về phân phối chuẩn, từ đó ta có thể tính xác suất các

biến cố cần thiết bằng cách dùng bảng số phân phối chuẩn.

µ

X

2

Định lý: Nếu

~

N

(0,1)

X N µσ thì ,

~

(

)

− σ

Định lý Moivre – Laplace: Nếu

khi n lớn.

X N np np (

~

,

(1

p−

))

X B n p thì

~ ( ,

)

[V1, tr.62-63]

V1 chú ý thêm về định lý Moivre – Laplace “Định lý nói rằng khi n lớn ta xấp

xỉ phân phối nhị thức bằng phân phối bình thường” (V1, tr. 63). Phần chú ý mà V1

np

p

n 5, (1

đưa ra không nói rõ n lớn là bao nhiêu mà nêu điều kiện là: “Để xấp xỉ này được tốt

≥ ” (V1, tr. 63-64) ) 5

thì phải thỏa mãn các điều kiện sau: 0,1 < p < 0,9;

Phân phối bình thường giữ một vai trò quan trọng trong thống kê.

a. Rất thường gặp

Theo Borel, một biến ngẫu nhiên là kết quả của nhiều nguyên nhân, mỗi nguyên nhân

tác động một ít và không có nguyên nhân nào là quyết định, thì biến ngẫu nhiên đó có

phân phối bình thường.

Vậy:

- Các số đo về đặc tính sinh học: Chiều cao, cân nặng, huyết áp, nồng độ, … hầu như

có phân phối bình thường.

- Trong xã hội, số con trong một gia đình, sự lợi tức hàng năm, sản lượng một vụ mùa,

đơn vị diện tích,… tuân theo phân phối bình thường

- Sai số trong đo lường về vật lý cũng có phân phối bình thường.

b. Vai trò trung tâm

Như đã thấy, phân phối bình thường là giới hạn của phân phối nhị thức, phân phối

Poisson khi n lớn.

Một định lý gọi là định lý giới hạn trung tâm nói lên vai trò đặc biệt của phân phối

bình thường. [V1, tr.66]

Cuối cùng, V1 trình bày vai trò của phân phối bình thường:

118

Định lý giới hạn trung tâm được trình bày nhưng không chứng minh trong

1, X

2, …, X

n) rút từ một dân số có

µ

x

n

Chương VI - Lý thuyết mẫu như sau: “Với mẫu (X

2σ < ∞ , thì

− σ

trung bình µ, phương sai ~ N(0; 1) khi n → ∞” [V1, tr. 99]

V còn chú ý thêm rằng: “Định lý này rất quan trọng với người làm thống kê,

với mẫu lớn thì X gần như có phân phối bình thường, bất chấp đặc tính X trong dân

số có phân phối gì.” [V1, tr. 99]

Có thể việc đưa vào chú ý này là lý do để sau đó V1 không thực hiện KĐ đặc

tính X trong dân số có PPC hay không, ngay cả khi cỡ mẫu n < 30 khi đề cập đến

bài toán ước lượng khoảng tin cậy và KĐ giả thuyết TK về trung bình. V1 cũng

không cho biết cỡ mẫu bằng bao nhiêu được coi là mẫu lớn nhưng trong các bài

toán ở phần TK, V1 thường cho cỡ mẫu lớn khi n ≥ 30.

Chúng tôi sẽ phân tích kỹ hơn điều này trong các phần tiếp theo.

4.2.2. PPC trong ước lượng khoảng tin cậy

Ước lượng khoảng tin cậy và KĐ giả thuyết TK là hai bài toán có quan hệ mật

thiết với nhau. Trong bài toán một mẫu, nếu trung bình hoặc tỷ lệ lý thuyết nằm

trong khoảng tin cậy của trung bình hoặc tỷ lệ của dân số thì sự khác biệt giữa hai

đại lượng cần so sánh không có ý nghĩa TK và ngược lại. Trong bài toán hai mẫu

thực nghiệm nếu khoảng tin cậy chứa 0 thì sự khác biệt giữa hai đại lượng cần so

sánh không có ý nghĩa TK và ngược lại.

Trong phần này, V1 trình bày hai bài toán ước lượng: Ước lượng khoảng tin

cậy cho trung bình và cho tỷ lệ.

σ

µ= ±

x C

2σ thì khoảng tin cậy là

Về bài toán ước lượng khoảng tin cậy cho trung bình, V1 nêu 2 trường hợp:

n

với - Nếu đã biết phương sai

γ 2

µ= ±

x C

2σ và n < 30 thì khoảng tin cậy là

Φ(C) = ⇒ giá trị C theo PPC.

s n

1)

− theo phân phối Student.

nγ− (

- Nếu chưa biết phương sai

với C = 1 t

119

2σ . Chỉ có duy nhất một bài tập (tự giải) trong V2 có nêu ra trường

V1 không đưa ra một ví dụ hay bài tập (có lời giải) nào minh họa cho trường

hợp đã biết

Một phản ứng kết tinh chất A trong một quy trình sản xuất cho trung bình 34kg chất A

khô, với độ lệch chuẩn 0,75.

Thay đổi một chi tiết của quy trình và thử 10 lần, ta được trung bình 34,35kg chất A

khô.

a. Chi tiết được thay đổi có làm thay đổi trọng lượng chất A được sản xuất không?

b. Chi tiết này có làm tăng trọng lượng chất A không? [V2, tr.98]

hợp này:

Về vấn đề cỡ mẫu trong bài toán ước lượng khoảng tin cậy cho trung bình để

n

sai số ước lượng không vượt quá ε cho trước, V1 chứng minh và đưa ra công thức

2 2 C s 2 ε

n ≥

30

2sσ = 2

tìm cỡ mẫu tối thiểu là và trong trường hợp chưa biết phương sai thì khảo

sát một mẫu đủ lớn ( ) và lấy .

Đối với vấn đề tìm cỡ mẫu cho ước lượng tỷ lệ p, cũng giống như phần ước

f

f

)

= ±

p

f C

lượng khoảng tin cậy cho trung bình, V1 đưa ra công thức tìm khoảng tin cậy cho tỷ

− (1 n

lệ là

Đối với việc tìm cỡ mẫu trong bài toán ước lượng khoảng tin cậy cho tỷ lệ để

2 C f

f

)

n

sai số ước lượng không vượt quá εcho trước, V1 chứng minh và đưa ra công thức

(1 2 ε

2

n

tìm cỡ mẫu tối thiểu trong trường hợp đã có mẫu thăm dò là . Trong

C 24 ε

với trường hợp chưa có mẫu thăm dò thì công thức tìm cỡ mẫu tối thiểu là

γ 2

⇒ giá trị C theo PPC. Φ(C) =

4.2.3. PPC trong KĐ giả thuyết TK nói chung

KĐ giả thuyết TK là một phần kiến thức quan trọng trong chương trình XS-

TK của IV, được V1 trình bày trong Chương VIII.

Mở đầu, V1 đưa ra một ví dụ 4.1 để dẫn đến nhu cầu của KĐ giả thuyết TK

trong y học.

120

Tỷ lệ bệnh A trong một dân số là 20%. Một chương trình điều trị bệnh A được tiến

hành. Sau một thời gian nhất định, người ta chọn ngẫu nhiên 100 người trong dân số

và khám thấy có 12 người bị bệnh A. Vấn đề đặt ra là sau khi thực hiện chương trình

điều trị bệnh A, tỷ lệ bệnh A trong dân số có thực sự khác 20% không ? [V1, tr.137]

Ví dụ 4.1

Theo ví dụ 4.1, yêu cầu ở đây chỉ là so sánh xem có sự khác biệt hay không về

tỷ lệ bệnh sau khi thực hiện một chương trình điều trị bệnh A. Câu hỏi trong ví dụ

4.1 không yêu cầu đánh giá xem chương trình điều trị bệnh A có hiệu quả hay

không, tức là có làm giảm tỷ lệ bệnh này hay không.

Trong phần tiếp theo, V1 đưa ra định nghĩa về giả thuyết TK, mục đích và ý

Một giả thuyết thống kê có thể định nghĩa là một mệnh đề liên quan đến một đặc tính

hay nhiều đặc tính trong một dân số. Bằng những biện pháp kiểm định, ta có thể kết

luận giả thuyết thống kê đưa ra có phù hợp với thực tiễn hay không, tức là tương thích

với các dữ kiện quan sát hay không. Mục đích của kiểm định giả thuyết thống kê là

giúp ta đi đến những kết luận liên quan đến một hay nhiều đặc tính trong dân số từ

việc khảo sát trên một mẫu được lấy ngẫu nhiên từ dân số đó. [V1, tr.137]

nghĩa của việc KĐ giả thuyết TK:

Các loại giả thuyết TK được giới thiệu trong V1 bao gồm H0 (giả thuyết

không) -“không có sự khác biệt” và HA (đối thuyết hay giả thuyết đối của H0) - giả

thuyết đối lập với H0, dùng để thay thế nếu giả thuyết H0 bị bác bỏ. Giả thuyết HA

không được V1 khẳng định là giả thuyết một đuôi hay hai đuôi nhưng cách trình

bày của V1 cho thấy đây chính là giả thuyết hai đuôi trong KĐ giả thuyết TK:

“Trong ví dụ trên, giả thuyết H0 là “p’ = p” và giả thuyết HA là “p’ ≠ p””.

Khi không đủ cơ sở để bác bỏ giả thuyết H0, V1 gọi là “chấp nhận H0”. Việc

chấp nhận hay bác bỏ H0 có thể phạm phải sai lầm do giả thuyết H0 liên quan đến

toàn bộ dân số nhưng việc KĐ giả thuyết này chỉ dựa vào một mẫu khảo sát. Theo

V1 thì khi KĐ giả thuyết TK có hai khả năng xảy ra: “1- H0 đúng (thực sự p’ = p)

nhưng ta bác bỏ H0, chấp nhận HA ; 2 - H0 sai (trong thực tế p’ ≠ p) nhưng ta chấp

nhận H0”

121

V1 phân tích về hai loại sai lầm trong KĐ giả thuyết TK và gọi tên là sai lầm

loại I và sai lầm loại II tương ứng với hai khả năng nói trên đồng thời khẳng định

Hai sai lầm này có tính đối kháng, tức là muốn hạn chế khả năng sai lầm loại I thì lại

tăng khả năng sai lầm loại II và ngược lại. Nếu tăng kích thước mẫu lên thì sẽ hạn chế

được khả năng sai lầm của hai loại nhưng đồng thời cũng làm tăng chi phí và sự khó

khăn. [V1, tr.138]

rằng:

V1 không khẳng định trong hai loại sai lầm nói trên thì sai lầm nào “nghiêm

trọng hơn” mà thông qua việc trình bày mức ý nghĩa dựa vào “nguyên lý biến cố có

Quy tắc kiểm định giả thuyết được đặt ra sao cho xác suất sai lầm loại I không vượt

quá một số α nhỏ không đáng kể nào đó. P(sai lầm loại I) = P (bác bỏ H0/ H0 đúng) ≤

α. Khi đó α được gọi là mức ý nghĩa hoặc ngưỡng sai lầm. Trên cơ sở mức ý nghĩa α,

ta hạn chế sai lầm loại II. [V1, tr.138]

xác suất nhỏ”, V1 “khuyên” nên hạn chế sai lầm loại II:

Cuối cùng của phần mở đầu chương KĐ giả thuyết TK, V1 trình bày quy tắc

Để kiểm định H0 lấy ngẫu nhiên một mẫu. Căn cứ vào mẫu quan sát đó, ta xây dựng

thống kê T(x1, x2,…, xn).

Giả sử khi H0 đúng, ta biết được luật phân phối của thống kê T(x1, x2,…, xn) (như tuân theo phân phối chuẩn, Student, Fisher, χ2

E…).

Khi đó ta biết được tα sao cho P(|T(x1, x2,…, xn)| > tα / H0 đúng) = α.

Nếu |T(x1, x2,…, xn)| > tα thì bác bỏ giả thuyết H0 vì theo nguyên lý biến cố có xác

suất nhỏ thì biến cố “|T(x1, x2,…, xn)| > tα / H0 đúng” không xảy ra trong lần thử đầu

tiên.

Nếu |T(x1, x2,…, xn)| ≤ tα thì ta không có cơ sở để bác bỏ giả thuyết H0 nên ta chấp

nhận H0. [V1, tr.139]

KĐ. Quy tắc này được hình thành dựa vào nguyên lý biến cố có XS nhỏ:

Trên đây chúng tôi đã phân tích sự tồn tại của khái niệm PPC trong bài toán

KĐ TK nói chung. Với mục đích làm rõ hơn các đặc trưng của quan hệ thể chế

R(IV, O), chúng tôi sẽ xem xét sự hiện diện của khái niệm này trong các phép KĐ

cụ thể. Về các phép kiểm này, V1 đưa vào 4 loại:

- Phép kiểm u dùng để KĐ giả thuyết so sánh hai tỷ lệ, hai trung bình khi đã

biết phương sai;

122

2χ dùng để KĐ giả thuyết so sánh nhiều tỷ lệ

- Phép kiểm chi bình phương

2χ ) ;

(vấn đề so sánh hai tỷ lệ là một trường hợp riêng, và do đó cũng có thể sử

dụng

- Phép kiểm t dùng để KĐ giả thuyết so sánh hai trung bình khi chưa biết

phương sai và cỡ mẫu n < 30;

- Phép kiểm Fisher F dùng để KĐ giả thuyết so sánh hai phương sai.

Do khuôn khổ có hạn của luận án, chúng tôi chỉ tập trung phân tích tác động

của PPC trong các phép kiểm u và t.

4.2.4. PPC trong bài toán KĐ giả thuyết TK về hai tỷ lệ

Phép kiểm u dùng để so sánh hai tỷ lệ trong các trường hợp: so sánh hai tỷ lệ

thực nghiệm và lý thuyết, so sánh hai tỷ lệ thực nghiệm độc lập, so sánh hai tỷ lệ

khi số liệu ghép cặp.

Trong dân số D, tỷ lệ có đặc tính X là p. Sau khi thực hiện những giải pháp nhằm thay

đổi tỷ lệ có đặc tính X trong dân số D, người ta muốn khảo sát sự khác nhau có ý nghĩa

thống kê giữa p và p’. Lấy một mẫu cỡ n từ dân số đó, gọi f là tỷ lệ có đặc tính X

trong mẫu.

4.2.4.1. So sánh tỷ lệ thực nghiệm và tỷ lệ lý thuyết

Thực hiện phép kiểm u

- Đặt giả thuyết H0: p’ = p; HA: p’ ≠ p

=

Nếu H0 đúng thì

u

N

~

(0,1)

f p

)

− p − p (1 n

- Nếu

u ≤

1,96

(hoặc 2,58) thì chấp nhận H0.

α=

- Nếu

(hoặc 0,01)

u >

1,96

(hoặc 2,58) thì bác bỏ H0, chấp nhận HA,

0, 05

≥ . [V1, tr.140]

Điều kiện: 0,1

0,9;

) 5

< < p

np

5; (1 n

p

Trích dẫn trên cho thấy V1 đã trình bày tường minh kỹ thuật giải quyết kiểu

tlτ để chỉ kỹ thuật này. Ký hiệu u ở đây chỉ phép kiểm được sử dụng là u, chữ cái

u 2 1

nhiệm vụ Ttl1 so sánh tỷ kệ thực nghiệm và tỷ lệ lý thuyết. Chúng tôi dùng ký hiệu

tl1 (tl là viết tắt của “tỷ lệ”) gắn với kiểu nhiệm vụ Ttl1, còn số 2 để nói rằng đây là

123

α=

0, 05

phép kiểm hai đuôi. Xét về yếu tố công nghệ, chúng tôi thấy V1 không giải thích ở

đây về hai hằng số 1,96 và 2,58 ứng với hoặc 0,01. Nhưng thực ra thì điều

đó đã được trình bày trong phần ước lượng khoảng tin cậy cho trung bình và cho tỷ

(

,...,

~ (1,

)

X độc lập và

B p nên khi xấp xỉ phân phối nhị thức thành PPC

X X , 1

2

)n

iX

< < p

0,9;

np

n 5; (1

p

lệ do biến ngẫu nhiên u ~ N(0; 1). Theo định lý giới hạn trung tâm, do

≥ . (Đặng Hùng ) 5

thì cỡ mẫu n phải lớn và thỏa điều kiện 0,1

Thắng, 2010)

Tuy nhiên, V1 đã không giải thích về điều kiện này do trước đó không trình

bày định lý giới hạn trung tâm cho mô hình nhị thức.

Để minh họa phép kiểm u cho kiểu nhiệm vụ Ttl1, V1 đưa ra ví dụ sau:

Trong một dây chuyền sản xuất thuốc có 20% viên không đạt tiêu chuẩn. Một cải tiến

được thực hiện và sản xuất thử 100 viên thấy có 12 viên không đạt chuẩn.

Cải tiến trên có thực sự thay đổi tỷ lệ không đạt chuẩn trong dây chuyền sản suất

không?

Ví dụ 4.2

Giải:

Ta có f = 0,12; p = 0,2, n = 100

Đặt giả thuyết H0: p’ = p; HA: p’ ≠ p

=

=

u

2

f p

)

− p − p (1 n

Do |u| > 1,96 nên bác bỏ H0, chấp nhận HA, α = 0,05.

Kết luận: Sự cải tiến trên làm thay đổi tỷ lệ viên không đạt chuẩn α = 0,05.

[V1, tr.141]

Một vấn đề đáng chú ý là câu hỏi của bài toán trong ví dụ 4.2 là “cải tiến có

làm thay đổi tỷ lệ viên không đạt chuẩn không ?” nên đặt giả thuyết hai đuôi như

trên là phù hợp. Nếu câu hỏi là “Cải tiến trên có làm giảm tỷ lệ viên không đạt

chuẩn hay không ?” thì giả thuyết một đuôi là phù hợp. Để trả lời câu hỏi này, V1

Đặt giả thuyết H0: p’ = p; HA: p’ < p

giới thiệu về phép kiểm u một đuôi.

124

=

Nếu H0 đúng thì

u

~

N

(0;1)

f p

)

− p − (1 p n

- Nếu

(hay

) thì chấp nhận H0.

u ≥ −

1, 64

u ≥ −

2,33

- Nếu u < -1,64 (hay u < - 2,33) thì bác bỏ H0, chấp nhận HA, α= 0,05 (hoặc 0,01)

[V1, tr.141]

tlτ ,để giải quyết trường hợp đối thuyết HA là p > p’. Nhưng kỹ thuật thứ hai này

u 1 1

Như vậy, đối với Ttl1, V1 đã đưa vào kỹ thuật thứ hai, chúng tôi ký hiệu là

chỉ xuất hiện duy nhất một lần qua ví dụ trên. Các ví dụ và bài tập về KĐ giả thuyết

TK trong V1 cũng như V2 đều sử dụng phép kiểm hai đuôi, kể cả trong những

trường hợp cần thiết phải sử dụng phép kiểm một đuôi.

4.2.4.2. So sánh hai tỷ lệ thực nghiệm độc lập

Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2

f

f 1

2

=

=

với

~

(0;1)

u

N

Nếu H0 đúng thì

p

+ +

n f 1 1 n 1

n f 2 2 n 2

+

(1

)

p

p

1 n 1

1 n 2

  

  

- Nếu

(hoặc 2,58) thì ta chấp nhận H0

u ≤

1,96

- Nếu

u >

1,96

(hoặc 2,58) thì ta bác bỏ H0, chấp nhận HA, α= 0,05 (hoặc 0,01)

≥ [V1 tr.142]

n p

n p

5

Điều kiện 0,1 < p < 0,9 và 1

25;

u

Để so sánh 2 tỷ lệ thực nghiệm độc lập, V1 giới thiệu phép kiểm u như sau:

tlτ giải quyết kiểu nhiệm vụ

2 2

Trích dẫn trên chính là các bước của kỹ thuật

Ttl2 - so sánh hai tỷ lệ thực nghiệm độc lập. Ta thấy là V1 chỉ trình bày kỹ thuật sử

dụng phép kiểm hai đuôi, không trình bày kỹ thuật sử dụng phép kiểm một đuôi. Ví

dụ 4.3 sau đây minh họa cho bài toán so sánh hai tỷ lệ thực nghiệm độc lập bằng

phép kiểm hai đuôi.

Điều trị bằng phương pháp 1 để trị bệnh A cho 102 bệnh nhân, ta thấy khỏi bệnh 82

người. Điều trị bằng phương pháp 2 để trị bệnh A cho 98 bệnh nhân, ta thấy khỏi bệnh

69 người. So sánh hiệu quả của hai phương pháp.

Ví dụ 4.3

125

=

=

=

=

Giải: Ta có

f

p

;

;

0, 75

f 1

2

+ +

82 102

69 98

n f 1 1 n 1

n f 2 2 n 2

Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2

f

f 1

2

=

=

Ta có

1, 64

u

+

(1

)

p

p

1 n 1

1 n 2

  

  

Do |u| ≤ 1,96 nên chấp nhận H0.

Kết luận: Hiệu quả của hai phương pháp trên khác nhau không có ý nghĩa. [V1, tr.143]

n p

n p

5

≥ hoàn toàn được thỏa

25;

Trong ví dụ 4.3, điều kiện 0,1 < p < 0,9 và 1

mãn nhưng V1 không thực hiện việc kiểm tra này, việc này được trao lại cho SV.

Ví dụ 4.3 yêu cầu so sánh hiệu quả của hai phương pháp 1 và 2. Hiệu quả khỏi

bệnh được thể hiện qua tỷ lệ khỏi bệnh khi điều trị bằng hai phương pháp nên bài

toán đưa về so sánh hai tỷ lệ thực nghiệm độc lập.

n p

5

Mặc dù không được trình bày một cách tường minh nhưng đối với các mẫu

≥ trong bài toán so sánh hai tỷ lệ

n p 1

25;

0,9;

< < p

np

5; (1 n

p

không thỏa điều kiện 0,1 < p < 0,9;

≥ trong bài toán so ) 5

thực nghiệm độc lập và điều kiện 0,1

sánh tỷ lệ thực nghiệm và tỷ lệ lý thuyết, V1 cung cấp một phép kiểm khác để thực

hiện việc so sánh hai tỷ lệ thực nghiệm độc lập đó là phép kiểm chi bình phương mà

chúng tôi không đi sâu phân tích.

4.2.4.3. So sánh hai tỷ lệ thực nghiệm có số liệu đôi

u

Đây là kiểu nhiệm vụ thứ ba về so sánh hai tỷ lệ, chúng tôi ký hiệu là Ttl3. Kỹ

tlτ là sử dụng phép kiểm u cũng được V1 trình bày tường minh như sau:

2 3

Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2

=

hoặc

Theo giả thuyết H0, bài toán trở về so sánh tỷ lệ thực nghiệm

f 1

n 1 +

n 1

n 2

với tỷ lệ lý thuyết p = 0,5.

=

f

2

n 2 +

n 1

n 2

0,5

f 1

=

=

Tính

u

n 1 n 1

− n 2 + n 2

− 0,5 + n 1

n 2

thuật

126

- Nếu

u ≤

1,96

(hoặc 2,58) thì chấp nhận H0.

- Nếu

(hoặc 2,58) thì bác bỏ H0, chấp nhận HA, α= 0,05 (hoặc 0,01)

u >

1,96

[V1, tr.143]

n+

n Điều kiện 1

≥ 2 10

n+

u N

(0,1)

Ở đây V1 không nói rõ biến ngẫu nhiên u tuân theo luật PPC, nhưng các con

n 1

≥ 2 10

số 1,96 và 2,58 cho biết ~ . V1 cũng không nói nếu điều kiện

không thỏa mãn thì sử dụng phép kiểm nào. Các ví dụ minh họa cho phép kiểm chi

u

bình phương được V1 trình bày sau đó cho phép giải quyết bài toán này.

tlτ trong bài toán so sánh hai tỷ lệ

2 3

Ví dụ 4.4 sau đây minh họa cho kỹ thuật

thực nghiệm có số liệu đôi.

Hai loại thuốc giảm đau A và B thử trên cùng 100 bệnh nhân, kết quả 45 người đều

thấy giảm đau (GĐ), 35 người đều thấy không giảm đau (KGĐ), 15 người thấy GĐ

đối với thuốc A, và KGĐ đối với thuốc B, 5 người thấy KGĐ đối với thuốc A, GĐ đối

với thuốc B. Hai loại thuốc này có tác dụng giảm đau khác nhau không?

Ví dụ 4.4

Giải: Chỉ cần chú ý kết quả.

Đặt giả thuyết H0: p1 = p2 ; HA: p1 ≠ p2

0,5

f 1

=

=

Ta có

= 2,24

u

n 1 n 1

− n 2 + n 2

− 0,5 + n 1

n 2

Do |u| > 1,96 nên bác bỏ H0, chấp nhận HA, α= 0,05.

Kết luận: Hai loại thuốc A và B có tác dụng giảm đau khác nhau có ý nghĩa.

[V1, tr.144]

Khi |u| = 2,24 < 2,58 ta có thể chấp nhận H0. Khi chấp nhận H0, ngưỡng sai lầm β

không biết.

Khi |u| = 2,24 > 1,96 thì bác bỏ H0, α = 0,05. Trong trường hợp này ta nên bác bỏ H0.

Trong trường hợp cần thiết có thể tiến hành thử nghiệm lại với cỡ mẫu lớn hơn.

[V1, tr.144]

Trong phần chú ý sau đây, V1 giải thích tại sao lấy ngưỡng sai lầm α = 0,05:

Như vậy đã có sự khác biệt trong quyết định bác bỏ hay chấp nhận H0 nếu lấy

ngưỡng sai lầm khác nhau. Lý do lấy α = 0,05 để bác bỏ giả thuyết H0 là vì nếu

α = 0,01 sẽ dẫn đến chấp nhận H0, khi đó không biết sai lầm loại II (β). Điều này

127

phù hợp với quy tắc của KĐ giả thuyết TK là bác bỏ H0 vì H0 còn gọi là giả thuyết

vô hiệu, giả thuyết không mong muốn của nhà nghiên cứu.

4.2.5. PPC và bài toán KĐ giả thuyết về hai trung bình

Loại bài toán thứ hai trong chương này được trình bày trong V1 là bài toán so

sánh hai trung bình. Đây cũng là một trong những bài toán thường gặp nhất trong

y học. Để giải quyết bài toán này, V1 trình bày hai phép kiểm: Nếu phương sai dân

2σ đã biết thì thực hiện phép kiểm u; nếu phương sai dân số

2σ chưa biết thì thực

số

hiện phép kiểm t. Các phép kiểm mà V1 trình bày là phép kiểm hai đuôi, không có

bài toán KĐ giả thuyết TK nào trong V1 được thực hiện bằng phép kiểm một đuôi,

dù rằng có bằng chứng cho thấy sử dụng phép kiểm một đuôi sẽ phù hợp hơn.

4.2.5.1. So sánh hai trung bình thực nghiệm và lý thuyết

2σ đã biết.

Chúng tôi gọi đây là kiểu nhiệm vụ Ttb1 (tb là viết tắt của « trung bình »)

• Khi phương sai

Đặt giả thuyết H0: µ’ = µ ; HA: µ’ ≠ µ

µ

=

~ N(0;1)

Theo giả thuyết H0, ta có

u

x σ

/

n

- Nếu |u| ≤ 1,96 (hoặc 2,58) thì ta chấp nhận H0

- Nếu |u| > 1,96 (hoặc 2,58) thì ta bác bỏ H0, chấp nhận HA, α = 0,05 (hoặc 0,01)

V1 trình bày phép kiểm u như sau:

Chú ý: Nếu n ≥ 30 thì

2sσ = 2

Một phương pháp chiết suất dược liệu cho trung bình 150g cao/1kg dược liệu và σ =

20g. Một cải tiến được thực hiện. Sau khi chiết suất 30 lần, ta được trung bình 160g

cao/1kg dược liệu. Kết luận ?

Ví dụ 4.5

Giải: Đặt giả thuyết H0: µ’ = µ; HA: µ’ ≠ µ

µ

=

= 2,7 . Do |u| > 2,58 nên ta bác bỏ H0, chấp nhận HA, α = 0,01

u

x σ

/

n

Kết luận: Cải tiến trên là một cải tiến thực sự, α = 0,01. [V1, tr.163]

u

tbτ để chỉ kỹ thuật giải quyết kiểu nhiệm vụ Ttb1 mà

2 1

Chúng tôi dùng ký hiệu

V1 đã đưa vào. Kỹ thuật này chính là sử dụng phép kiểm u hai đuôi. Nếu sử dụng

128

phép kiểm u hai đuôi thì khi bác bỏ H0 chỉ có thể kết luận “Sự khác biệt giữa µ’ và

µ có ý nghĩa”. Thế nhưng V1 đã kết luận sự khác biệt đó theo chiều hướng µ’ > µ

để dẫn đến “Cải tiến trên là một cải tiến thực sự” mà không giải thích lý do. Có lẽ

do số liệu nêu trong bài toán mang lại bằng chứng cho thấy thấy sau cải tiến, lượng

dược liệu chiết suất trung bình cao hơn hẳn trước khi cải tiến. Nhưng nếu không có

bằng chứng đó thì sao ? Dường như V1 đã không cung cấp một kỹ thuật đầy đủ để

2σ chưa biết và cỡ mẫu n < 30

giải quyết Ttb1.

Đặt giả thuyết H0: µ’ = µ; HA:µ’ ≠ µ

µ−

=

~ Student (n-1)

Theo giả thuyết H0, ta có

t

n

x s /

- Nếu |t| ≤ tα (n-1) (với α = 0,05 hoặc 0,01) thì ta chấp nhận H0

- Nếu |u| > tα (n-1) (với α = 0,05 hoặc 0,01) thì ta bác bỏ H0, chấp nhận HA, mức ý

nghĩa α.

t

• Khi phương sai

tbτ để chỉ kỹ thuật thứ hai đã được V1 đưa vào để giải

2 1

Chúng tôi dùng ký hiệu

quyết Ttb1. Kỹ thuật này bao hàm việc sử dụng phép kiểm t hai đuôi. Ví dụ sau được

V1 đưa ra để minh họa cho kỹ thuật này.

Điều tra lượng cholesterol toàn phần trong huyết thanh của 25 bệnh nhân bị bệnh X,

ta có X = 176 mg, s = 40 mg. Theo tài liệu µ = 156 (hằng số sinh học của người

bình thường). Kết luận ?

Ví dụ 4.6

Giải: Đặt giả thuyết H0: µ’ = µ; HA: µ’ ≠ µ

µ−

=

Ta có

= 2,5.

t

n

x s /

Do |t| > t0,05 (24) = 2,069 bác bỏ H0, chấp nhận HA, α = 0,05.

Kết luận: Lượng cholesterol trung bình của người bị bệnh X và người bình thường

khác nhau không có ý nghĩa. [V1, tr.167]

Phần lý thuyết và ví dụ trên về trường hợp σ2 chưa biết và n < 30 cho thấy V1

đã sử dụng phép kiểm t mà không nhắc tới các điều kiện của phép kiểm này, đó là

DL phải có PPC. Hơn nữa, khi n < 30 thì sự khác biệt giữa phương sai mẫu và

129

phương sai dân số có thể có ý nghĩa TK, điều này cũng không được V1 kiểm tra

trước khi thực hiện KĐ giả thuyết.

4.2.5.2. So sánh hai trung bình thực nghiệm độc lập

Để đánh giá sự khác biệt về trung bình giữa 2 mẫu, V1 trình bày bài toán so

sánh hai trung bình thực nghiệm độc lập khi σ đã biết và chưa biết. Chúng tôi gọi

2

2

đây là kiểu nhiệm vụ Ttb2.

1σ và

2σ đã biết:

Xét hai mẫu từ hai dân số có phân phối chuẩn

N µ σ và ;

)

(

(

)

;

,x x 1 2

2 1

1

2 N µ σ . Gọi 2

2

lần lượt là số trung bình của 2 mẫu đó.

Đặt giả thuyết H0: µ1 = µ2 và HA: µ1 ≠ µ2.

x 1

=

Theo H0, ta có

u

~

N

(0,1)

x 2 2 2 σ σ + 2 1 n n 2 1

- Nếu |u| ≤ 1,96 (hoặc 2,58) thì chấp nhận H0

- Nếu |u| > 1,96 (hoặc 2,58) thì bác bỏ H0, chấp nhận HA, α = 0,05 (hoặc 0,01)

• Khi

Chú ý: n1 ≥ 30, n2 ≥ 30 thì có thể xem như σ1 ≅ s1, σ2 ≅ s2 [V1, tr.163-164]

=

=

2 σ σ + 2

2

x 1

x

~

N

;

)

Trong phần này, V1 giải thích phân phối của hiệu hai trung bình có PPC

2 − µ µ µ σ ( 1

2

2 1 n 1

n 2

. Điều này cũng đã được giải thích trong

Chương VI - Lý thuyết mẫu. Ở đó, V1 có trình bày nhưng không chứng minh định lý

giới hạn trung tâm với chú ý rằng: “Định lý này rất quan trọng đối với người làm

TK, với mẫu lớn thì X gần như có phân phối bình thường, bất chấp đặc tính X trong

dân số có phân phối gì”. (V1, tr.99)

u

Như vậy, theo V1, nếu mẫu lớn thì đặc tính X gần như có PPC mà không cần

tbτ , nó bao hàm việc sử

2 2

KĐ tính chuẩn của DL. Chúng tôi gọi kỹ thuật trên là

2

2

dụng phép kiểm u hai đuôi.

2σ , cỡ mẫu nhỏ hơn 30

1σ và

• Khi chưa biết

130

Xét hai mẫu từ hai dân số có phân phối chuẩn

N µ σ và ;

(

)

(

)

;

,x x 1 2

2 1

1

2 N µ σ . Gọi 2

2

lần lượt là số trung bình của 2 mẫu đó. Muốn so sánh µ1 và µ2 trước hết ta phải

có 2 1

2 σ σ= 2

Đặt giả thuyết H0: µ1= µ2 và HA: µ1 ≠ µ2

+

(

(

1)

n 1

2 s 2

=

=

=

Ước lượng

σ σ σ 1 2

2 s 1 +

n 2 − 2

1) n 1

n 2

x 2

=

+

Theo giả thuyết H0, ta có

~

(

2)

t

Student n 1

n 2

σ

+

x 1 1 n 1

1 n 2

+

- Nếu |t| ≤

thì chấp nhận H0

2)

t n ( α 1

n 2

+

- Nếu |t| >

thì ta bác bỏ H0, chấp nhận HA, α = 0,05 (hoặc 0,01)

2)

t n ( α 1

n 2

Chú ý: Khi so sánh hai số trung bình µ1 và µ2 của hai dân số có phân phối

2

2

chuẩn,

E ta có thể thực hiện phép

N µ σ dù chưa biết giá trị của σ2

)

;

)

N µ σ và ;

2(

1(

kiểm t như trên, không cần để ý đến n < 30 hay n ≥ 30 [V1, tr.168-169]

Chú ý mà V1 đưa ra không rõ ràng vì phần lý thuyết đang nói đến trường hợp

E và n < 30, hơn nữa V1 chỉ nói n mà không nói rõ n1 < 30 hay n2 < 30

chưa biết σ2

hoặc cả hai mẫu đều có cỡ mẫu đều nhỏ hơn 30.

2 t tbτ . 2

Kỹ thuật này là sử dụng phép kiểm t hai đuôi nên chúng tôi ký hiệu là

Trong phần lý thuyết trên, V1 có nhắc đến điều kiện của phép kiểm t: DL được lấy

2 σ σ= 2

2 1

từ hai dân số có PPC và phương sai đồng nhất , nhưng không có bước nào

thực hiện kiểm tra hai điều kiện này.

Trong ví dụ 4.7 dưới đây, V1 không thực hiện kiểm tra hai điều kiện của phép

kiểm t mà ngầm ẩn rằng hai điều kiện đó đã được thỏa mãn.

Muốn so sánh hai loại thuốc bổ A và B, người ta cho hai nhóm người thử.

Kết quả:

Nhóm uống thuốc A: 5, 4, 2, 1, 4

Nhóm uống thuốc B: 6, 5, 4, 2, 6, 4, 5

Kết luận ?

Ví dụ 4.7

131

Giải: Đặt giả thuyết H0: µ1= µ2 và HA: µ1 ≠ µ2

+

(

(

1)

n 1

2 s 2

=

=

Tính

=

σ σ σ 1 2

2 s 1 +

n 2 − 2

1) n 1

n 2

A x A

1 A-A x A

2A

E Suy ra t =E

= 1,562

σ

1 nA 1A

1 A A+A A nA 2A

Do |t| < tR0,05R (10) = 2,228 nên chấp nhận HR0R. Kết luận: Hai loại thuốc bổ A và B khác nhau có ý nghĩa. [V1, tr.168-169]

A A E E E E E E

Có lẽ việc KĐ tính chuẩn của DL có thể là khó đối với SV vì trước đó V1

chưa trình bày phương pháp KĐ tính chuẩn của DL khi nó ở dạng “thô”.

Ngoài ra, V1 cũng không thực hiện KĐ tính đồng nhất của hai phương sai và

Chú ý: Trước khi thực hiện bài toán so sánh hai số trung bình µR1R và µR2R khi σ chưa

2

2

biết và cỡ mẫu n < 30, ta phải so sánh hai phương sai

1σ và

2σ . Nếu hai phương sai

2

2

1σ và

2σ khác nhau không có ý nghĩa thì ta thực hiện so sánh hai số trung bình µR1R và

µR2R. [V1, tr.169]

2

2

tính phương sai nhập, công việc này được trao lại cho SV bởi chú ý sau:

1σ =

Chú ý trên chỉ yêu cầu kiểm tra điều kiện hai phương sai đồng nhất

nhưng phương pháp KĐ điều này thì V1 không nhắc đến. Hơn nữa nếu khi so sánh

hai phương sai dẫn đến phương sai không đồng nhất thì V1 cũng không đưa ra

phương án để giải quyết vấn đề này.

Như vậy, ứng với hai trường hợp của TRtb2R, V1 đã đưa vào hai kỹ thuật. Chúng

2 u tbτ , 2

2 t tbτ . 2

tôi gọi hai kỹ thuật, đó là

4.2.5.3. So sánh hai trung bình thực nghiệm khi có số liệu đôi (ghép cặp)

Đây là kiểu nhiệm vụ T Rtb3R liên quan đến vấn đề KĐ giả thuyết về trung bình.

Xét hai dãy số liệu đôi xR1iR và xR2iR với i = 1, …, n

x i

d

Tính xRdR = xR1iR – xR2iR và

x

= ∑ n

Đặt giả thuyết HR0R: µR1R= µR2R và HRAR: µR1 R≠ µR2R.

• Khi phương sai đã biết

132

=

Ta có

~

(0;1)

u

N

x d nσ /

d

- Nếu |u| ≤ 1,96 (hoặc 2,58) thì ta chấp nhận HR0

- Nếu |u| > 1,96 (hoặc 2,58) thì ta bác bỏ HR0R, chấp nhận HRAR, α = 0,05 (hoặc 0,01)

2

d

(

)

x

=

với

[V1, tr.165]

2 s d

Chú ý: n ≥ 30 thì ta có thể xem như d

s σ= d

x i n

1

=

dx và

2s chỉ thực hiện trên dãy DL

Như vậy, khi σ đã biết thì u ~ N(0;1) với mọi giá trị của cỡ mẫu n và việc tính

x d

x 1 i

x 2

i

, không quan tâm toán các giá trị

dx . Chúng tôi gọi đây là kỹ thuật

u 2 tbτ 3

đến phân phối của DL ban đầu và dãy DL

• Khi phương sai chưa biết và cỡ mẫu n < 30

Phần này tương tự bài toán so sánh hai trung bình thực nghiệm, số liệu đôi khi

d

=

t

σ đã biết nhưng thay vì thực hiện phép kiểm u thì thực hiện phép kiểm t với

x /

n

s d

=

~ Student(n-1)

x d

x 1 i

x 2

i

có PPC. Tuy Để thực hiện phép kiểm t, điều kiện cần thiết là DL

nhiên, trong ví dụ 4.8, V1 cũng không thực hiện kiểm tra điều kiện chuẩn của xd.

Hơn nữa, trong ví dụ 4.8, có thể thực hiện phép kiểm t một đuôi vì có bằng chứng

cho thấy có sự khác biệt đáng kể về trung bình trước và sau thực nghiệm.

6 con chuột được cho uống thuốc A để thử độ tăng lực. Chuột được cho leo cây cho

đến khi kiệt sức, thời gian tính bằng phút. Kết quả:

Kết luận ?

Ví dụ 4.8

Giải: Đặt giả thuyết H0: µ1 = µ2 và HA: µ1 ≠ µ2.

d

=

= 3,962

t

x /

n

s d

Do |t| > t0,05 (5) = 2,57 nên bác bỏ H0, chấp nhận HA, α = 0,05

Kết luận: Thuốc A có ảnh hưởng đến độ tăng lực. [V1, tr.171]

133

Kết luận mà V1 đưa ra phù hợp với giả thuyết hai đuôi đã đặt ra nhưng chưa

kết luận được thuốc A có tác dụng tăng lực không vì thực nghiệm muốn chứng tỏ

độ tăng lực của thuốc A trên chuột. Trong trường hợp cần chứng tỏ thuốc A có tác

dụng tăng lực thì phép kiểm t một đuôi là cần thiết. Tuy nhiên, V1 không trình bày

phép kiểm t một đuôi đối với trường hợp so sánh hai trung bình thực nghiệm khi có

số liệu ghép cặp.

Ta thấy rằng đối với Ttb3 cũng đã có hai kỹ thuật được đưa vào trong V1.

u 2 tbτ , 3

2 t tbτ . 3

Chúng tôi gọi đó là

4.2.6. Những tổ chức toán học liên quan đến KĐ giả thuyết TK

Sau khi phân tích V1, chúng tôi đã xem xét toàn bộ hệ thống bài tập về KĐ giả

thuyết TK hiện diện trong V2. Chúng tôi thấy V2 không đưa thêm vào kiểu nhiệm

vụ nào, cũng không đề xuất một kỹ thuật nào mới. Như vậy, trong Iv, bài toán KĐ

giả thuyết TK về trung bình và tỷ lệ liên quan đến 6 kiểu nhiệm vụ nêu trong

Bảng 4.3.

Bảng 4.3. Các kiểu nhiệm vụ và kỹ thuật liên quan đến phép kiểm u và t

134

Kỹ thuật giải quyết những kiểu nhiệm vụ này đã được V1 trình bày rõ ràng và

chúng tôi cũng đã trích dẫn đầy đủ ở trên. Vì thế, trong Bảng 4.3 chúng tôi chỉ tổng

hợp nét đặc trưng cho mỗi kỹ thuật: dùng phép kiểm u hay t, một đuôi hay hai đuôi.

Yếu tố công nghệ giải thích cho các kỹ thuật gồm hai loại. Thứ nhất, đó chính

là các kiến thức lý thuyết chứng minh cho công thức tính u, t được nêu trong mỗi kỹ

thuật. Thứ hai, đó nguyên tắc KĐ: việc chấp nhận H0 phụ thuộc vào khoảng ước

lượng với độ tin cậy chọn trước.

4.2.7. Nhận xét về phần KĐ giả thuyết TK trong V1 và V2

Việc phân tích V2 đã củng cố thêm những nhận xét mà chúng tôi đã rút ra khi

nghiên cứu V1.

- Đối với bài toán so sánh hai tỷ lệ, kỹ thuật là sử dụng phép kiểm u. Đối với

bài toán so sánh hai trung bình thì có thể sử dụng phép kiểm u nếu đã biết phương

sai, sử dụng phép kiểm t nếu chưa biết phương sai và kích thước mẫu nhỏ hơn 30.

- Phép kiểm được trình bày trong V1 và V2 nói chung là phép kiểm hai đuôi.

Cụ thể, đối với tất cả các bài toán KĐ giả thuyết TK, V1 và V2 đều không đưa vào

tlτ để giải quyết kiểu nhiệm vụ

u 1 1

phép kiểm một đuôi, trừ khi đề cập đến kỹ thuật

Ttl1 - so sánh tỷ lệ thực nghiệm và tỷ lệ lý thuyết. Nhưng kỹ thuật này chỉ xuất hiện

một lần duy nhất trong V1 và hoàn toàn không được gặp lại trong V2.

- Giả thuyết TK mà V1 đặt ra trong các bài toán KĐ giả thuyết TK là: H0 - “Sự

khác biệt không có ý nghĩa”, còn đối thuyết HA luôn phát hiểu ở dạng “Sự khác biệt

có ý nghĩa”. Điều này xuất phát từ chủ trương ưu tiên cho phép kiểm hai đuôi như

nhận xét trên. Thực ra, trong một số bài toán có mặt trong V1 và V2, việc phát biểu

đối thuyết HA ở dạng p < p’ (hay p > p’), µ < µ’ (hay µ > µ’) là hợp lý. Nhưng các

đối thuyết dạng này không được xem xét, vì kỹ thuật sử dụng phép kiểm một đuôi

không được đưa vào. Trong ví dụ 4.8 nêu trên, khi H0 bị bác bỏ thì V1 đưa ra kết

luận µ > µ’ mà không giải thích vì sao.

t

- Điều kiện thực hiện phép kiểm t là DL có PPC (và phương sai đồng nhất).

t 2 tbτ , 2

2 t tbτ , 1

2 3

tbτ dùng trong bài toán so sánh hai trung

Thế nhưng, trong các kỹ thuật

135

bình thì việc kiểm tra điều kiện PPC không được nói đến. Phần lời giải các ví dụ và

bài tập trong V1, V2, việc kiểm tra này cũng không được thực hiện (vấn đề KĐ tính

chuẩn của DL là một bài toán độc lập, được nêu trong phần ứng dụng của phép

kiểm chi bình phương). DL cho trong tất cả các ví dụ của V1 và bài tập của V2 đều

đã có PPC nên việc SV có chú ý đến điều kiện DL có PPC trong phép kiểm t hay

không cũng không gây ra sai lầm nếu các tính toán là đúng. Tuy nhiên, nếu gặp bài

toán thực tế mà ở đó DL không có PPC thì chúng tôi dự đoán là SV sẽ thực hiện

ngay phép kiểm t mà không chú ý đến điều kiện của phép kiểm này. Trong một số

trường hợp, cách làm này sẽ gây nên sai lầm ở SV.

Như vậy, việc KĐ tính chuẩn của DL không phải là trách nhiệm của SV vì nó

không được nhắc đến trong kỹ thuật giải quyết các bài toán KĐ được V1 và V2

xem xét.

Phân tích trên cho phép chúng tôi dự kiến hai kiểu sai lầm của SV:

- Luôn sử dụng phép kiểm hai đuôi để KĐ các giả thuyết về so sánh hai

trung bình.

- Không kiểm tra tính chuẩn của DL khi dùng phép kiểm t.

B. SO SÁNH CÁC QUAN HỆ THỂ CHẾ R(IV, O), R(IF, O), R(IA, O)

Nghiên cứu đối chiếu quan hệ của các thể chế khác nhau đối với đối tượng O

(KĐ giả thuyết TK và PPC) sẽ giúp ta nhìn rõ hơn đặc trưng của thể chế IV, từ đó

thấy được cái gì có thể tồn tại nhưng đã không tồn tại trong IV.

Nghiên cứu so sánh sẽ được thực hiện thông qua việc đối chiếu các giáo trình

dùng cho DH môn XS – TK ở ba thể chế IV, IF, IA. Đối với IF, IA đó là hai giáo

trình ở hai trường Đại học Y mà chúng tôi đã giới thiệu ở đầu chương 4, được ký

hiệu là F đối với giáo trình của Đại học Grenoble (Pháp) và là A đối với giáo trình

của Đại học Nam Illinois (Hoa Kỳ).

4.3. CÁC ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IF, O)

Bảng 4.4 đưa ra một cái nhìn tổng thể về sự giống và khác nhau ở nội dung thể

hiện trong hai giáo trình V1 và F.

136

Bảng 4.4. Phân phối chương trình XS-TK trong V1 và F

Giáo trình Xác suất Thống kê Phương pháp Tổng cộng

5 5 1 Số chương 11 F Số trang (%) 91 (39,2) 119 (51,3) 22 (9,5) 232

1 8 4 Số chương 13 V1 Số trang (%) 34 (9,6) 220 (61,8) 102 (28,6) 356

[Nguồn: Bessot A., 2013]

Dưới đây, chúng tôi sẽ chỉ ra những điểm giống và khác nhau giữa hai giáo trình

V1 và F.

4.3.1. Những điểm giống nhau

4.3.1.1. Về thứ tự và vị trí của các kiến thức

- Thứ tự các lĩnh vực được đưa vào giáo trình hoàn toàn giống nhau: XS - TK

- Phương pháp chuyên biệt cho các tình huống y học.

- TK chiếm vị trí quan trọng hơn XS trong cả hai giáo trình: Ở F là 51,3% và

V1 là 61,8%.

4.3.1.2. Về phần XS cơ bản

- Khái niệm về biến cố (sự kiện) và quan hệ giữa các biến cố: Phép hội, phép giao,

phép hiệu, phép bù; các khái niệm về biến cố độc lập, phụ thuộc, xung khắc được

trình bày đầy đủ trong cả hai giáo trình.

- Hai giáo trình đều trình bày định nghĩa XS theo cổ điển mà không yêu cầu kiểm

tra tính đồng khả năng của các biến cố. Đặc biệt, V1 và F không trình bày định

nghĩa XS theo tần suất nhưng F trình bày thêm định nghĩa XS theo độ đo.

- Các công thức tính XS: Cộng, nhân, XS có điều kiện, XS toàn phần, Bayes.

- Các khái niệm về biến ngẫu nhiên, hàm mật độ XS và phân phối XS của các biến

ngẫu nhiên rời rạc và liên tục, trung bình và phương sai của biến ngẫu nhiên.

- Các phân phối XS được đưa vào hai giáo trình: Nhị thức, Poisson, chuẩn.

137

4.3.1.3. Về các ứng dụng ứng dụng của XS trong chẩn đoán

- Những ứng dụng này được trình bày thành một chương riêng biệt: ở V1 là Chương

11 - Xác suất trong chẩn đoán, còn ở F là Chương 2 - Độ nhạy, độ chuyên và giá trị

tiên đoán

- V1 và F đều trình bày các khái niệm về độ nhạy, độ chuyên và giá trị tiên đoán

như là các XS có điều kiện được sử dụng trong chẩn đoán.

- Mặc dù V1 và F sử dụng các ký hiệu khác nhau nhưng đều trình bày 3 phương

pháp xác định giá trị tiên đoán: bảng 2×2, Bayes, tỷ cơ hội.

4.3.1.4. Về phần TK

- Mức độ quan trọng của KĐ giả thuyết TK trong cả hai giáo trình là tương đương

nhau: Trong V1 gồm 57/232 trang, chiếm tỷ lệ 24,6 % còn trong F gồm 101/356

trang, chiếm tỷ lệ 28,4%.

- Các sai lầm trong KĐ giả thuyết TK, phân biệt sai lầm loại 1 (α) và sai lầm loại 2

(β), quy tắc đặt giả thuyết TK, quy tắc quyết định bác bỏ/ không bác bỏ (chấp nhận)

giả thuyết H0 được trình bày rõ ràng và có hình ảnh minh họa.

- Việc KĐ giả thuyết TK trong hai giáo trình cũng đồng nghĩa với kiểu nhiệm vụ so

sánh: So sánh hai trung bình, so sánh hai phương sai, so sánh hai tỷ lệ, so sánh

nhiều trung bình (phân tích phương sai), so sánh nhiều tỷ lệ (phép kiểm chi bình

(Chi bình

phương), so sánh nhiều phương sai (phép kiểm Bartlett và Cochran). - Các phép KĐ giả thuyết TK: u (Chuẩn), t (Student), F (Fisher), χ2

phương), Bartlett, Cochran, Duncan đều được trình bày và minh họa bằng nhiều ví

dụ trong V1 và F.

- Khi sử dụng biến ngẫu nhiên t có phân phối Student trong ước lượng khoảng tin

cậy và KĐ giả thuyết TK, V1 và F đều nhắc đến các điều kiện về tính chuẩn của DL

và phương sai đồng nhất nhưng không yêu cầu kiểm tra các điều kiện này.

4.3.2. Những điểm khác nhau

4.3.2.1. Về phần XS

- XS có vị trí quan trọng hơn trong V1 so với F: Ở V1 có 5 chương, 91 trang, chiếm

tỷ lệ 39,2% trong khi ở F có 1 chương, 34 trang, chiếm tỷ lệ 9,6%

138

- Các phương pháp chuyên biệt cho các tình huống y học ở F có vai trò quan trọng

hơn so với V1, điều này thể hiện ở chỗ: Trong V1 chỉ có một chương với tên gọi là

“Xác suất trong chẩn đoán” trong khi trong F có 4 chương là “Nguyên lý phương

pháp luận về thử nghiệm lâm sàng” (Chương 10), “TK cho dịch tễ học” (chương

11), “Phân tích sống sót” (chương 12) và “Phân tích quyết định lâm sàng”

(chương 13)

Sự khác biệt về phần XS giữa hai giáo trình đã dẫn đến sự xuất hiện các tổ

chức toán học hỗn hợp khác nhau. Tổ chức toán học hỗn hợp ở đây là sự kết nối

giữa các đối tượng toán học và đối tượng ngoài toán học chính là các kiến thức

y học.

Chẳng hạn trong V1, tồn tại tổ chức toán học hỗn hợp về sự kết nối giữa đối

tượng toán học là công thức Bayes và phương pháp ra quyết định lâm sàng dựa trên

mô hình ngưỡng. Mô hình này cho phép bác sĩ đưa ra quyết định có cho đối tượng

nghi ngờ có bệnh B làm XN T hay không hoặc có cho điều trị hay không. Quyết

định này tùy thuộc vào XS bệnh rơi vào vùng nào trong ba vùng: Vùng theo dõi,

vùng XN và vùng điều trị của mô hình ngưỡng. Để tính XS bệnh thì bác sĩ cần phải

dùng đến các đối tượng toán học như: XS tiền nghiệm, XS hậu nghiệm, công thức

XS có điều kiện, công thức Bayes,…

Còn trong F tồn tại tổ chức toán học hỗn hợp với tên gọi “Phân tích sống sót”.

Đây là thủ tục dùng để so sánh hai phương pháp điều trị cho các bệnh có tỷ lệ tử

vong cao như ung thư, tim mạch, AIDS,… mà các phương pháp điều trị này được

đánh giá trong các mô hình có biến phụ thuộc là biến nhị phân nhưng không quan

tâm đến yếu tố thời gian. Trong các mô hình này, mặc dù đã đánh giá sự khác biệt

về tỷ lệ tử vong hoặc tỷ lệ khỏi bệnh giữa hai phương pháp điều trị là giống nhau

nhưng thời gian tử vong hoặc khỏi bệnh của hai nhóm có thể khác nhau. Phương

pháp phân tích sống sót cho phép tìm ra sự khác biệt giữa hai nhóm điều trị, xử lý

được các trường hợp đối tượng nghiên cứu bỏ cuộc trong thời gian nghiên cứu. Đối

tượng toán học trong phân tích sống sót là ước tính Kaplan-Meier [F, tr.333-349],

139

tức là tính XS sống sót tích lũy tại các thời điểm khác nhau và sử dụng phép kiểm

logrank [F, tr.349-352] để so sánh hai hàm XS tích lũy của hai nhóm điều trị.

4.3.2.1. Về phần TK

a. Đặt giả thuyết TK

- Trong V1: Giả thuyết H0: Sự khác biệt giữa hai đại lượng cần so sánh không có ý

nghĩa TK, giả thuyết HA đối lập với H0 nên V1 gọi HA là giả thuyết đối. V1 chỉ

trình bày phép kiểm hai đuôi, không trình bày lý thuyết phép kiểm một đuôi trong

các bài toán KĐ giả thuyết TK về so sánh hai trung bình.

- Trong F: Luôn đặt giả thuyết H0 là “Hai đại lượng cần so sánh bằng nhau”. F gọi

giả thuyết thay thế là H1 với 3 trường hợp ≠, <, >.

Ví dụ 4.9 sau đây minh họa về giả thuyết hai đuôi trong F.

Trong 50 người ở vùng Basques có 35 người có kết quả XN nhóm máu có Rh dương

tính. Có thể kết luận rằng 85% dân số Pháp có Rh dương tính không?

Đặt giả thuyết:

Ví dụ 4.9

Gọi p là tỷ lệ thực tế trong khảo sát 50 người p =

= 0,7

35 50

nπ = 43,5 > 5 và n(1-π) = 7,5 > 5

=

~ N(0, 1)

z

p 0,85 × 0,85 0,15 50

=

= 2,97

z

− | 0, 7 0,85 | × 0,85 0,15 50

Tra bảng phân phối chuẩn với α = 0,05 thì 2,97 > 1,96 nên H0 bị bác bỏ

Tỷ lệ những người trong máu có Rh+ nhỏ hơn 0,85 với p giá trị < 0,005

[F, tr.193-194]

H0: π = 0,85; H1: π ≠ 0,85

Thật dễ dàng vô hiệu hóa một giả thuyết (một phản ví dụ là đủ) trong khi việc xác

nhận một giả thuyết đòi hỏi phải tìm ra tất cả những tình huống có thể và không một

tình huống nào trong số đó mâu thuẫn với giả thuyết đang xét. [F, tr.148]

Vì H0 là giả thuyết vô hiệu nên cần phải tìm cách bác bỏ:

140

H1 là giả thuyết thay thế khi bác bỏ H0: “Việc bác bỏ H0 tạo thuận lợi cho một

giả thuyết khác, gọi là giả thuyết thay thế mà ta sẽ ký hiệu là H1” [F, tr.155]

- Trong V1, nếu từ DL thu được chưa đủ cơ sở để bác bỏ H0 thì V1 kết luận chấp

nhận H0 (sự khác biệt không có ý nghĩa TK).

- Trong F, nếu chưa đủ cơ sở bác bỏ H0 thì kết luận không bác bỏ H0 (không đồng

nghĩa với H0 đúng): “Nếu H0 đáng tin cậy thì không bác bỏ H0, nếu H0 không đáng

tin cậy thì bác bỏ H0” [F, tr.155]

Khác với V1, F còn trình bày lý thuyết và minh họa bằng hình ảnh về phép

kiểm một đuôi và hai đuôi, đồng thời đưa ra một ví dụ (ví dụ 4.10) trong đó có sự

khác biệt về kết luận giữa dùng giả thuyết một đuôi và hai đuôi.

Một nghiên cứu trên 2 nhóm phụ nữ ở độ tuổi sinh đẻ từ 20 đến 25, sinh thường một

bé qua ngả âm đạo. Nhóm 1 gồm 49 phụ nữ bỏ hút thuốc vào đầu thai kỳ, nhóm 2 gồm

49 phụ nữ không hút thuốc. Trọng lượng trung bình của trẻ sơ sinh trong nhóm 1 là 3010 (g) và phương sai là 1702 (g2)và của nhóm 2 là 2950 (g) với phương sai là 1682 (g2)

Hỏi trọng lượng trung bình của trẻ sơ sinh trong hai nhóm khác nhau có ý nghĩa thống

kê không?

Đặt H0: Trọng lượng trung bình trẻ sơ sinh trong hai nhóm khác biệt không có ý nghĩa

thống kê.

Trường hợp 1. Đặt H1: Trọng lượng trung bình trẻ sơ sinh trong hai nhóm khác biệt có

ý nghĩa thống kê.

Trường hợp 2. Đặt H1: Trọng lượng trung bình trẻ sơ sinh trong nhóm mẹ không hút

thuốc cao hơn so với nhóm mẹ hút thuốc.

=

= 1,76

u

− 3010 2950 2 2

+

170 49

168 49

Trường hợp 1: KĐ hai đuôi, |u| < 1,96 nên không bác bỏ H0.

Trường hợp 2: KĐ một đuôi, u > 1,64 nên H0 bị bác bỏ.

Kết luận: Trọng lượng trung bình trẻ sơ sinh trong nhóm mẹ không hút thuốc cao hơn

so với nhóm mẹ hút thuốc [F, tr.206-208]

Ví dụ 4.10

141

Ngoài quy tắc quyết định bác bỏ hay không bác bỏ H0 bằng mức ý nghĩa α

(sai lầm loại 1), F còn trình bày quy tắc quyết định về giả thuyết có ý nghĩa TK hay

không bằng cách sử dụng phương pháp p giá trị (p_value), điều này hoàn toàn vắng

Tra bảng PPC với α = 0,05 thì 2,97 > 1,96 nên H0 bị bác bỏ. Tỷ lệ những người trong

máu có Rh+ nhỏ hơn 0,85 với p < 0,005 [F, tr.193-194]

mặt trong V1.

Về các phép kiểm trong KĐ giả thuyết TK, chúng tôi nhận thấy, V1 trình bày

các phép kiểm theo sơ đồ 4.1 (Bessot A., 2013). Còn trong F, các phép kiểm được

trình bày theo sơ đồ 4.2 (Bessot A., 2013).

Sơ đồ 4.1. Phân bố các phép kiểm trong V1

142

Sơ đồ 4.2. Phân bố các phép kiểm trong F

b. Về các kiểu nhiệm vụ so sánh

Trong hai giáo trình có sự khác biệt về số lượng kiểu nhiệm vụ so sánh:

- Trong V1: Có 3 kiểu nhiệm vụ rút ra từ 18 trường hợp trong sơ đồ trên là: So sánh

các tỷ lệ, so sánh các trung bình, so sánh các phương sai.

- Trong F: Có 2 kiểu nhiệm vụ như sau: So sánh các tỷ lệ, so sánh các trung bình.

Phân tích phương sai là kiểu nhiệm vụ con của kiểu nhiệm vụ so sánh các trung

bình trong hai trường hợp: So sánh hai trung bình thực nghiệm khi cỡ mẫu n1 < 30

hoặc/và n2 < 30, so sánh nhiều hơn hai trung bình.

Khi DL không có PPC, F trình bày các phép kiểm phi tham số để giải quyết

bài toán KĐ giả thuyết TK, trong khi ở V1 thì DL mặc nhiên có PPC nên V1 không

- Kiểm định tham số dựa trên các giả thuyết liên quan đến các phân phối ngầm của các

biến được khảo sát.

- Kiểm định phi tham số (dựa trên các thứ hạng) nếu nó không tạo ra một giả thuyết về

phân phối hoặc về các tham số được khảo sát. Trong những điều kiện giống nhau, các

kiểm định này không mạnh bằng kiểm định tham số (việc phát hiện sự khác nhau hay

trình bày các phép kiểm phi tham số.

143

sự tồn tại một hiệu ứng trong đám đông có xác suất yếu hơn). Ví dụ kiểm định chi

bình phương [F, tr. 381-382]

Để giải quyết một bài toán TK như ước lượng khoảng tin cậy, KĐ giả thuyết

TK hoặc các nghiên cứu chuyên biệt cho các tình huống y học như trong các nghiên

cứu cắt ngang, cắt dọc, đoàn hệ, bệnh - chứng, thử nghiệm vaccine, nghiên cứu lâm

sàng đối chứng ngẫu nhiên thì công việc đầu tiên của nhà nghiên cứu là xác định cỡ

mẫu. Tuy nhiên, V1 chỉ trình bày cách xác định cỡ mẫu trong các bài toán ước

lượng khoảng tin cậy cho một trung bình và cho một tỷ lệ, không trình bày phương

pháp xác định cỡ mẫu cho các nghiên cứu chuyên biệt cho các tình huống y học.

Đối với một biến nhị phân, tỷ lệ thành công hay thất bại sẽ được so sánh giữa hai

=

=

nhóm. Để so sánh hai tỷ lệ, số người trong mỗi nhóm

được tính theo công

n

n E

n R

thức:

2

+

+

(

(1

)

(1

)

))

β

Z − 1

Z − α 1

/2

π π 2 (1 0 0

π E

E

=

n

π π π R R 2 δ

=

Với

là sự khác biệt về hiệu quả (sự khác biệt tối thiểu thể hiện trên lâm

δ π π E R

sàng liên quan đến tỷ lệ thành công π

E và π

R giữa hai nhóm) mong muốn và π0 là tỷ lệ

+ π π R

E

=

[F, tr.289]

thành công trong cả hai nhóm theo H0 và

π 0

2

Ngược lại, F trình bày đầy đủ phương pháp xác định cỡ mẫu cho các bài toán này.

Ví dụ 4.11 minh họa bài toán xác định cỡ mẫu trong nghiên cứu lâm sàng đối

chứng ngẫu nhiên được trình bày trong F.

Chúng ta muốn đánh giá về hiệu quả của phương pháp mới trong điều trị khối u ác

tính ở da sống sót sau 5 năm. Với phương pháp điều trị trước đây, tỷ lệ sống sót sau 5

năm là 60%. Chúng ta ta hy vọng tỷ lệ sống sót sau 5 năm khi điều trị bằng phương

pháp mới tăng thêm 20%. Cần bao nhiêu bệnh nhân trong mỗi nhóm với sai sót α =

5% và sai sót β = 10%.

2

+

+

×

=

= 108

n

2

(1, 28 0, 6(1 0, 6) 0,8(1 0,8) 1,96 2 0, 7(1 0, 7)) 0, 2

Như vậy cần chọn 108 người vào mỗi nhóm và tổng cộng là 216 người cho hai nhóm.

[F, tr.289]

Ví dụ 4.11

144

4.4. CÁC ĐẶC TRƯNG CỦA QUAN HỆ THỂ CHẾ R(IA, O)

Khác với thể chế IV và IF, trong thể chế IA, trước khi học chuyên ngành khoa

học sức khỏe SV đã được trang bị các kiến thức cơ bản về khoa học tự nhiên, xã hội

và y học. Chính vì thế, việc dạy học XS-TK cho SV ở thể chế IA có thuận lợi là SV

đã có một khối lượng kiến thức chuyên ngành nhất định, tạo thuận lợi cho việc gắn

môn XS – TK với thực tiễn nói chung, Y học nói riêng.

Giáo trình A gồm 13 chương, trong đó chỉ có một chương duy nhất (chương 4)

trình bày các kiến thức về XS cơ bản và các phân phối XS thông dụng, 12 chương

còn lại tập trung vào các vấn đề về XS-TK cho chuyên ngành y. Hầu hết các ví dụ

đều là các nghiên cứu thực tế, dựa trên DL thực tế nhằm giải quyết các vấn đề mà y

học quan tâm. Điều này chứng tỏ, thể chế IA rất chú trọng đến vấn đề đào tạo nghề

nghiệp cho SV. Hơn nữa, những kiến thức về XS-TK được sử dụng trong các

nghiên cứu thực tế làm cho SV thấy được mục đích và ý nghĩa của môn học, từ đó

tạo động cơ và sự hứng thú trong học tập.

Trước khi phân tích, chúng tôi điểm lại ở đây nội dung chính của các chương

được trình bày một cách có hệ thống và chuyên sâu trong giáo trình A.

• Chương 1: Giới thiệu về nghiên cứu y học

Trong chương này, A trình bày mục đích, ý nghĩa của các nghiên cứu trong Y

học nói chung và trong dịch tễ học nói riêng.

• Chương 2: Thiết kế nghiên cứu trong Y học

Chương 2 trình bày các phương pháp thiết kế nghiên cứu trong Y học bao

gồm: nghiên cứu quan sát (báo cáo hàng loạt ca bệnh, nghiên cứu bệnh-chứng,

nghiên cứu cắt ngang, nghiên cứu cắt dọc, nghiên cứu đoàn hệ), nghiên cứu thực

nghiệm (thử nghiệm có đối chứng, thử nghiệm không đối chứng và thử nghiệm tự

đối chứng) và nghiên cứu tổng hợp. A cũng phân tích những thuận lợi và khó khăn

khi ứng dụng các phương pháp nghiên cứu nêu trên.

• Chương 3: Phân tích và biểu diễn dữ liệu trong bảng và đồ thị

Mục đích của chương là giới thiệu các loại DL khác nhau trong nghiên cứu y

học (định tính, định lượng); phân tích DL dựa vào trung bình, trung vị, yếu vị,

145

phương sai, độ lệch chuẩn, sai số chuẩn, hệ số biến thiên; cách trình bày DL trong

bảng, đồ thị, biểu đồ; phương pháp nhận diện DL có PPC hay không.

• Chương 4: Xác suất và các chủ đề liên quan đến quyết định rút ra từ dữ liệu

Ở đây A trình bày các khái niệm và quy tắc cơ bản của XS: Định nghĩa XS,

các công thức tính XS; biến ngẫu nhiên và hàm phân phối XS: phân phối nhị thức,

phân phối Poisson, PPC; phân phối mẫu, định lý và ứng dụng của định lý giới hạn

trung tâm; các khái niệm trong ước lượng khoảng tin cậy, KĐ giả thuyết TK.

• Chương 5: Các phương pháp nghiên cứu trên một nhóm đối tượng

Chương 5 trình bày ứng dụng của PPC và phân phối Student trong ước lượng

khoảng tin cậy và KĐ giả thuyết TK trên một nhóm đối tượng.

• Chương 6: Các phương pháp nghiên cứu trên hai nhóm đối tượng độc lập

Nội dung chương 6 giống chương 5 nhưng các nghiên cứu được thực hiện trên

hai nhóm đối tượng độc lập.

• Chương 7: Các phương pháp nghiên cứu về trung bình của ba hoặc nhiều hơn ba

nhóm đối tượng

Chương này giới thiệu phương pháp phân tích phương sai một yếu tố, hai yếu

tố không lặp và có lặp; các phương pháp phân tích phương sai phi tham số khi DL

quan sát không có PPC và phương sai các nhóm không đồng nhất.

• Chương 8: Các phương pháp nghiên cứu về quan hệ giữa các biến

Nội dung chính của chương là phương pháp hồi quy tuyến tính đơn biến,

phương pháp khảo sát tương quan dựa vào tỷ số chênh (OR) và nguy cơ tương đối

(RR)

• Chương 9: Phân tích sống sót

Chương này trình bày mục đích, ý nghĩa và phương pháp phân tích sống sót

dựa vào ước tính Kaplan-Meier và KĐ log-rank.

• Chương 10: Các phương pháp thống kê đa biến

Phân tích hồi quy và tương quan đa biến, hồi quy logistic, hồi quy phi tuyến là

những nội dung được đề cập trong chương.

• Chương 11: Nghiên cứu khảo sát

146

Ở đây, A trình bày các bước thực hiện một đề tài nghiên cứu y học: Xác định

câu hỏi nghiên cứu, xác định cỡ mẫu, thu thập DL, phân tích và xử lý DL và đưa ra

kết luận từ các kết quả phân tích.

• Chương 12: Phương pháp y học thực chứng và phân tích quyết định lâm sàng

- Các khái niệm trong y học thực chứng

- Độ chính xác của xét nghiệm

- Mô hình ngưỡng P-K

- Phương pháp tính giá trị tiên đoán (bảng 2×2, cây quyết định, tỷ cơ hội, phương

pháp Bayes)

- Đường cong ROC

• Chương 13: Đọc và phân tích các bài báo y học

Như vậy, nội dung trình bày trong A bao gồm các kiến thức về XS-TK trong

chẩn đoán – điều trị và nghiên cứu y học. Vấn đề đào tạo cho SV năng lực nghiên

cứu y học rất được A quan tâm. Các phương pháp, kỹ thuật cần thiết để thực hiện

một nghiên cứu y học được trình bày rất sâu và đầy đủ, từ thu thập, phân tích, xử lý

DL đến kết luận cuối cùng và cách đọc, phân tích, viết một bài báo y học.

Dưới đây chúng tôi sẽ tập trung phân tích chi tiết để làm rõ sự giống và khác

nhau giữa các giáo trình V1, F và A về kỹ thuật giải quyết bài toán KĐ giả thuyết

so sánh hai trung bình.

4.4.1. Sự giống nhau

• Cả ba giáo trình V1, F và A đều trình bày 3 kiểu nhiệm vụ liên quan đến bài

toán so sánh hai trung bình là

- Ttb1: So sánh trung bình thực nghiệm và lý thuyết

- Ttb2: So sánh hai trung bình thực nghiệm độc lập

- Ttb3: So sánh hai trung bình khi DL ghép cặp

• Về kỹ thuật thực hiện 3 kiểu nhiệm vụ trên:

- V1, F, A đều nhắc đến các bước: Đặt giả thuyết H0 và HA (H1), lựa chọn và

thực hiện phép kiểm, quyết định bác bỏ hay không bác bỏ giả thuyết H0

dựa vào giá trị ngưỡng.

147

- Các giả định của phép kiểm t (DL có PPC, phương sai đồng nhất, sự độc

lập của hai nhóm) đều được nêu trong cả ba giáo trình.

- Về cách chọn mức ý nghĩa (ngưỡng sai lầm loại 1), cả ba giáo trình đều thể

hiện việc chọn mức ý nghĩa nhỏ nhất khi bác bỏ giả thuyết H0 vì nhà

nghiên cứu không muốn bác bỏ H0 khi H0 đúng.

4.4.2. Sự khác nhau

• Cách đặt giả thuyết trong F và A bao gồm giả thuyết một đuôi hay hai đuôi

tùy theo mục đích của nhà nghiên cứu, trong khi ở V1 luôn là giả thuyết hai đuôi,

ngay cả khi nhà nghiên cứu muốn kiểm định sự lớn hơn hoặc nhỏ hơn của giá trị

trung bình. Hơn thế, A còn phân tích chọn giả thuyết một đuôi hoặc hai đuôi phải

Phép kiểm hai đuôi phù hợp khi nhà nghiên cứu không có sự mong đợi trước về giá trị

trong mẫu, họ muốn biết có hay không sự khác biệt giữa trung bình mẫu và trung bình dân

số theo cả hai hướng.

Phép kiểm một đuôi có thể được sử dụng khi nhà nghiên cứu có sự mong đợi về giá trị

trung bình mẫu và họ muốn kiểm tra xem nó lớn hơn hay nhỏ hơn giá trị trung bình của

dân số. [A, tr.104-105]

phù hợp với câu hỏi của bài toán KĐ giả thuyết:

• Về ký hiệu, các loại giả thuyết, giống như F, A dùng H0 để chỉ giả thuyết

không (null) và H1 để chỉ giả thuyết thay thế khi H0 bị bác bỏ.

Nếu không đủ cơ sở để bác bỏ giả thuyết không từ bằng chứng hiện có, A và F

0":

Nếu giả thuyết H0 bị bác bỏ vì bằng chứng thu được từ mẫu, thì giả thuyết thay thế

được khẳng định. Nếu bằng chứng không đủ để bác bỏ H0 thì nó được giữ lại nhưng

không có nghĩa là H0 đúng. Các nhà khoa học phân biệt giữa không bác bỏ và chấp

nhận giả thuyết, họ cho rằng một nghiên cứu sẽ tốt hơn có thể được thiết kế sao cho

H0 có thể bị bác bỏ. Vì vậy, theo truyền thống thì chúng ta không chấp nhận H0 từ

bằng chứng hiện tại, chúng ta chỉ đơn thuần khẳng định rằng nó không thể bị bác bỏ.

[A, tr. 104]

không dùng thuật ngữ “chấp nhận H0” mà dùng thuật ngữ "không bác bỏ H

• A luôn lựa chọn phép kiểm t để so sánh hai trung bình trong mọi trường hợp,

dù cỡ mẫu nhỏ hơn hay lớn hơn 30, phương sai đã biết hay chưa biết; trong khi V1

148

và F lựa chọn phép kiểm u(z) khi phương sai đã biết, chọn phép kiểm t khi cỡ mẫu

n < 30 và phương sai chưa biết.

Trước khi trình bày phép kiểm t, A có trình bày ba giả định của phép

- Dữ liệu quan sát trong mỗi nhóm có phân phối chuẩn

- Phương sai hai nhóm đồng nhất

- Hai nhóm đối tượng được nghiên cứu độc lập [A, tr.138-140]

kiểm này:

Viêc giả định dữ liệu có phân phối chuẩn bị vi phạm thì sẽ làm cho giá trị p thấp hơn

giá trị thực của nó, dẫn đến dễ dàng bác bỏ giả thuyết không và kết luận sự khác biệt

về trung bình giữa hai nhóm không có ý nghĩa. [A, tr. 138-139]

A giải thích rằng:

• Kỹ thuật KĐ trong A được chi tiết hóa thành 6 bước (đặt giả thuyết TK, xác

định phép kiểm phù hợp, lựa chọn mức ý nghĩa, xác định giá trị ngưỡng, tính giá trị

TK và kết luận). Điều này không được nói rõ trong V1 và F.

Trong các ví dụ, ở bước xác định phép kiểm phù hợp, A luôn phân tích bài

toán cần giải quyết để chọn phép kiểm hai đuôi hay một đuôi.

Cũng trong các ví dụ, A thường nhắc đến điều kiện để thực hiện phép kiểm đã

chọn (trong trường hợp so sánh hai trung bình thì đó là phép kiểm t và điều kiện của

nó là DL có PPC, phương sai đồng nhất). Dưới đây là một ví dụ như thế

(ví dụ 4.12).

Đo lượng 7α-HCO trước và sau 1 tháng phẫu thuật cắt bỏ túi mật của 51 bệnh nhân.

Gọi d là hiệu số của lượng 7α-HCO trước và sau phẫu thuật, kết quả

d =

21, 22

ng/mL và độ lệch chuẩn là

ds = 26,68 ng/mL. Các nhà nghiên cứu muốn kiểm tra sự

thay đổi này có ý nghĩa thống kê hay không.

Bước 1: Đặt giả thuyết

Gọi δlà hiệu số của sự khác biệt về lượng 7α-HCO trước và sau phẫu thuật. Chúng ta

muốn bác bỏ giả thuyết không trong hai tình huống khi 7α-HCO tăng và giảm có ý

δ

=

δ

nghĩa nên cần sử dụng phép kiểm hai đuôi với giả thuyết:

H

:

0;

H

:

≠ 0

0

1

Bước 2: Quyết định phép kiểm phù hợp

Ví dụ 4.12

149

Giả sử sự khác biệt d có phân phối chuẩn, phép kiểm phù hợp là phép kiểm t ghép

cặp với

=

~ Student(n-1)

t

0 n

d s /d

Bước 3: Lựa chọn mức ý nghĩa: chọn α = 0,01

=

Bước 4: Xác định giá trị ngưỡng:

C t=

2, 682

0,01(50)

d

=

=

=

Bước 5: Thực hiện tính toán:

t

5, 68

/

0 n

21, 22 0 26, 68 / 51

s d

Bước 6: Kết luận: Vì t > 2,682 nên bác bỏ H0, tức là lượng 7α-HCO thực sự khác biệt

trước và sau phẫu thuật cắt túi mật. ( p < 0,01) [A, tr.117-118]

• V1 không trình bày cách xử lý DL khi không thỏa mãn điều kiện của phép

kiểm t, trong khi ở F và A đều nêu phương pháp hoán chuyển DL hoặc sử dụng

phép kiểm phi tham số Wilcoxon khi DL không có PPC.

Ngoài ra, khi phân phối của DL bị lệch, A còn trình bày phương pháp hoán

chuyển theo hàm ln (cơ số e). Sau đó, A còn trình bày phương pháp hoán chuyển

Mặc dù cách hoán chuyển này không thường được sử dụng trong y học như hoán

chuyển theo hàm logarithm nhưng nó rất hữu ích khi hoán chuyển bằng hàm logarithm

làm cho dữ liệu bị lệch quá mức. [A, tr.123]

DL theo hàm căn bậc hai và chú ý rằng:

Khi tất cả các phương pháp hoán chuyển DL không làm cho DL có PPC, A

trình bày các phép kiểm phi tham số để khắc phục tình trạng này. Chẳng hạn, phép

kiểm Wilcoxon (Mann-Whitney) trong so sánh ghép cặp. Chúng tôi sẽ không đi sâu

vào các chi tiết toán học ở đây.

Cuối cùng, khi phương sai không đồng nhất, A đưa ra phương án thu thập DL

có cỡ bằng nhau trong cả hai nhóm.

Chúng tôi tóm tắt trong Bảng 4.5 về sự khác nhau giữa 3 giáo trình trong

việc giải quyết ba kiểu nhiệm vụ liên quan đến bài toán so sánh hai trung bình.

150

Bảng 4.5. Sự khác nhau giữa 3 giáo trình V1, F và A

V1

F

A

Nội dung

Tính toán cỡ mẫu Thu thập DL Đặt giả thuyết

Lựa chọn phép kiểm

Không DL giả định Hai đuôi n > 30: phép kiểm u (PPC) n ≤ 30: phép kiểm t (phân phối Student)

Có DL giả định hoặc thực tế. DL thực tế Một đuôi/ hai đuôi n > 30: phép kiểm z (PPC) n ≤ 30: phép kiểm t (phân phối Student)

Một đuôi/ hai đuôi n > 30: phép kiểm t (phân phối Student) n ≤ 30: phép kiểm t (phân phối Student)

Trình bày một phần riêng.

Không

Không

Phân tích các điều kiện của phép kiểm Kiểm tra các điều kiện của phép kiểm Phương pháp xử lý khi DL không có PPC

Kết luận

Hoán chuyển DL hoặc sử dụng phép kiểm phi tham số. Dựa vào giá trị ngưỡng C và giá trị p

Có kiểm tra trước khi thực hiện phép kiểm Hoán chuyển DL hoặc sử dụng phép kiểm phi tham số. Dựa vào giá trị ngưỡng C và giá trị p

Dựa vào giá trị ngưỡng C

4.5. KẾT LUẬN CHƯƠNG 4

PPC có vai trò quan trọng trong XS cũng như trong TK, là cơ sở cho hầu hết

các suy diễn TK. Những ứng dụng quan trọng của PPC được sử dụng trong XS

trong các bài toán tính xấp xỉ các giá trị XS của biến ngẫu nhiên có phân phối rời

rạc như phân phối nhị thức trong thể chế IV. Trong TK, PPC cùng với định lý giới

hạn trung tâm đã giải thích hầu hết các nguyên lý TK thể hiện trong các bài toán

ước lượng khoảng tin cậy và KĐ giả thuyết TK.

Trong các bài toán KĐ giả thuyết TK về trung bình, một trong những điều

kiện quan trọng khi sử dụng phép kiểm t là DL có PPC. Cả ba giáo trình V1, F và A

đều nêu yêu cầu này, nhưng trong các ví dụ và bài tập, việc kiểm tra các điều kiện

này không được yêu cầu thực hiện. Nếu DL không tuân theo PPC thì phải giải quyết

thế nào? Câu hỏi này không được đặt ra và dĩ nhiên không được trả lời trong thể chế

IV. Tuy nhiên, câu hỏi này đã được nêu ra trong thể chế IF, IA và phương pháp xử

ký khi điều kiện không thỏa mãn đã được nghiên cứu.

Liên quan đến bài toán KĐ giả thuyết TK về so sánh hai trung bình thực

nghiệm độc lập, phép kiểm một đuôi không hiện diện trong V1. Đây là một sự khác

biệt với F và A. Sự thiếu hụt phép kiểm một đuôi khiến SV thiếu kỹ thuật để KĐ

151

những giả thuyết trong đó người ta cần biết trung bình nào lớn hơn trung bình nào.

Mà những giả thuyết thuộc loại này lại rất thường gặp trong các nghiên cứu y học.

Mục tiêu đào tạo nghề đã được thể hiện trong ba thể chế IV, IF và IA đó là các

kiểu nhiệm vụ được đặt ra nhằm giải quyết các bài toán của y học, cụ thể là trong

bào chế, kiểm nghiệm, phát triển các loại thuốc; đánh giá và phát triển các phương

pháp, các thuật điều trị. Các kỹ thuật và công nghệ cũng được xây dựng để giải

quyết các kiểu nhiệm vụ này. Mục tiêu này càng thể hiện rõ hơn trong IA.

Từ những phân tích quan hệ thể chế R(IV, O), giới hạn vào kiểu nhiệm vụ so

sánh hai trung bình thực nghiệm độc lập, chúng tôi rút ra giả thuyết khoa học sau

đây:

Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép

giải thích sai lầm của SV:

R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so

sánh hai trung bình thực nghiệm độc lập.

R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung

bình thực nghiệm độc lập.

Kiểm chứng giả thuyết này là một trong những nội dung chính được chúng tôi

thực hiện trong phần thực nghiệm của chương 5.

152

CHƯƠNG 5

NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA GIẢNG VIÊN

VÀ QUAN HỆ CÁ NHÂN CỦA SINH VIÊN VỚI ĐỐI TƯỢNG O

Nghiên cứu thực tế đào tạo được thực hiện trên hai đối tượng chủ chốt của thể

chế IV - GV và SV. Mục đích đầu tiên là kiểm chứng tính thỏa đáng của giả thuyết

khoa học đã được hình thành từ phân tích thể chế của chúng tôi.

Như vậy, phần thứ nhất của chương trình bày một nghiên cứu thực tế DH của

GV. Quan sát thực hành của GV nhằm làm rõ bước chuyển hóa sư phạm từ tri thức

giáo khoa đến tri thức được dạy.

Liệu thực hành DH của GV có cho phép làm rõ ảnh hưởng của quan hệ thể

chế lên ứng xử của cá nhân của GV với "tri thức cần dạy" và do đó sẽ cho phép

củng cố (hoặc không) giả thuyết khoa học đã đặt ra? Câu hỏi ấy dẫn chúng tôi đến

một nghiên cứu quan sát lớp học về tiết học KĐ giả thuyết TK so sánh hai trung

bình thực nghiệm độc lập.

Phần thứ hai của chương là một nghiên cứu thực nghiệm trên đối tượng SV

năm thứ hai khoa Y và Khoa Dược ngay sau khi họ vừa học xong chương "Kiểm

định giả thuyết thống kê". Với thực nghiệm được thiết kế, chúng tôi mong muốn

kiểm tra tính thỏa đáng của giả thuyết về sự tồn tại của hai quy tắc hợp đồng DH đã

rút ra từ phân tích quan hệ thể chế đối với O.

5.1. NGHIÊN CỨU THỰC HÀNH DẠY HỌC CỦA GIẢNG VIÊN

Chúng tôi đã quan sát tiết dạy của một GV Đại học Y dược Tp HCM. Trong

tiết dạy này SV được nghiên cứu bài toán KĐ giả thuyết TK về so sánh hai trung

bình thực nghiệm độc lập. Bằng công cụ của Thuyết nhân học, chúng tôi sẽ xác định

những tổ chức toán học được dạy và tiến hành phân tích, đánh giá các tổ chức

didactic mà GV đã triển khai để truyền bá các tổ chức toán học liên quan đến đối

tượng O - một tri thức quan trọng và rất cần thiết trong nghiên cứu y học và thực

hành nghề nghiệp của các bác sĩ tương lai.

153

5.1.1. TỔ CHỨC TOÁN HỌC CẦN DẠY VÀ ĐƯỢC DẠY

Theo phân tích ở chương 4, các tổ chức toán học liên quan đến bài toán so

sánh hai trung bình được hình thành từ 3 kiểu nhiệm vụ sau đây:

Ttb1: So sánh trung bình thực nghiệm và trung bình lý thuyết

Ttb2: So sánh hai trung bình thực nghiệm độc lập

Ttb3: So sánh hai trung bình khi có số liệu đôi

Các kiểu nhiệm vụ trên đều là kiểu nhiệm vụ toán học vì kỹ thuật giải quyết

các kiểu nhiệm vụ này phải sử dụng công thức toán học để tính các giá trị như trung

bình, phương sai, độ lệch chuẩn, sai số chuẩn và các giá trị TK của phép kiểm u và

t. Mặc dù chúng giống nhau về mặt hình thức, nhưng điều kiện hợp thức thì khác

nhau khi sử dụng phép kiểm t và không được trình bày tường minh trong giáo trình

=

(

,...,

)

V1 cũng như trong giờ học trên lớp. Các điều kiện đó là:

x i

x n

x x , 1 2

thu thập từ dân số có PPC - Đối với kiểu nhiệm vụ Ttb1: DL

- Đối với kiểu nhiệm vụ Ttb2: DL thu thập từ 2 dân số có PPC và phương sai đồng

2 σ σ= 2

2 1

=

=

n 1,..., )

nhất

x i

x 1 i

i 2 ( x i

có PPC. - Đối với kiểu nhiệm vụ Ttb3: DL

t

Trong tiết học được quan sát SV chỉ nghiên cứu kiểu nhiệm vụ Ttb2. Đối với

2 u tbτ và 2

tbτ . Những gì quan sát

2 2

kiểu nhiệm vụ này, V1 đã đưa vào hai kỹ thuật

được cho thấy GV đã trình bày hai kỹ thuật đó.

5.1.2. TỔ CHỨC DIDACTIC

Từ băng ghi âm và những ghi chép khi quan sát, chúng tôi dựng lại biên bản

của tiết học và biên bản này được trình bày trong phần Phụ lục 3 của luận án. Trong

phần dưới, chúng tôi sẽ đi dọc theo biên bản tiết học để xác định tổ chức didactic

mà GV đã triển khai để làm cho SV nghiên cứu Ttb2.

Theo cách tiếp cận của Thuyết nhân học, hoạt động DH được xem như hoạt

động nghiên cứu một đối tượng O nào đó, cụ thể hơn là nghiên cứu một praxéologie

liên quan đến O. Giả sử T là kiểu nhiệm vụ mà từ đó praxéologie cần nghiên cứu

được hình thành. Hoạt động nghiên cứu này phải trải qua sáu thời điểm:

154

Thời điểm thứ nhất: thời điểm gặp gỡ lần đầu tiên với kiểu nhiệm vụ T.

Thời điểm thứ hai: thời điểm nghiên cứu kiểu nhiệm vụ T và xây dựng kỹ

thuật giải quyết T.

Thời điểm thứ ba: thời điểm làm việc với tổ chức toán học đã hoặc đang được

tạo ra.

/

Thời điểm thứ tư: thời điểm xây dựng môi trường công nghệ - lý thuyết, tức là

]θ Θ .

thời điểm tạo ra khối [

[T/

/

/

' /

]

/

τ θ Θ hoặc [T/ ]

τ θ Θ bằng cách chỉ ra các thành phần của nó.

Thời điểm thứ năm: thời điểm thể chế hóa, là thời điểm trình bày rõ tổ chức

Thời điểm thứ sáu: thời điểm đánh giá. Ở thời điểm này, GV đánh giá về các

tổ chức toán học đã được triển khai trong lớp học và cũng là lúc đánh giá HS về khả

năng làm chủ tổ chức toán học đã được tạo ra.

Dọc theo biên bản, chúng tôi sẽ xác định các thời điểm nghiên cứu này. Biên

bản ghi lại tất cả những gì xẩy ra trong lớp tuần tự theo thời gian. Căn cứ vào hoạt

động của GV và SV, chúng tôi phân biên bản tiết học thành 24 đoạn (xem Phụ lục

3). Những trích dẫn dưới đây đều lấy ra từ biên bản tiết học.

• Đoạn 1 – 8: GV ôn lại các bước thực hiện bài toán KĐ giả thuyết TK, nhấn

mạnh tầm quan trọng của việc kiểm tra các điều kiện của các phép kiểm: “Mỗi phép

kiểm đều có điều kiện áp dụng nghiêm ngặt, nếu không kiểm tra những điều kiện

này thì kết luận rút ra từ các phép kiểm có thể không đáng tin cậy, thậm chí sai

lầm”.

Như vậy, GV có nhắc đến điều kiện áp dụng của những phép kiểm đã học

trong bài toán so sánh các tỷ lệ trong bài học trước, đó chính là phép kiểm u và phép

kiểm chi bình phương. Thực tế cho thấy việc kiểm tra điều kiện của các phép kiểm

này khá dễ dàng và có thể thực hiện một cách nhanh chóng: “Chẳng hạn trong phép

kiểm u để so sánh hai tỷ lệ thì điều kiện cần kiểm tra là: np ≥ 5; n(1-p) ≥ 5; 0,1< p

< 0,9. Còn trong phép kiểm chi bình phương thì điều kiện đó là tần số lý thuyết

không nhỏ hơn 5”.

155

Ngay trong đoạn 1, GV đã giới thiệu mục đích của bài học: “Hôm nay chúng

ta học tiếp bài toán so sánh hai trung bình bằng phép kiểm u và t. So sánh hai trung

bình là bài toán tương đối phổ biến trong TK y học, nó dùng để so sánh các giá trị

trung bình của các biến định lượng”.

Khi khảo sát các nghiên cứu trong y học có sử dụng XS-TK, chúng tôi nhận

thấy có hai bài toán so sánh hai đại lượng, chủ yếu là hai trung bình và hai tỷ lệ. Để

đánh giá tác dụng của một loại thuốc hoặc một phương pháp điều trị mới, người ta

phải chia đối tượng nghiên cứu thành hai nhóm là nhóm bệnh (nhóm tác động thật

hoặc dùng thuốc thật) và nhóm chứng (nhóm tác động giả hoặc dùng giả dược).

Bước tiếp theo là theo dõi và ghi nhận các thông số cần quan tâm, thường là trung

bình hoặc tỷ lệ của hai nhóm này và dùng các phép kiểm TK để so sánh và đánh giá

hiệu quả giữa hai nhóm. So sánh hai tỷ lệ là các bài toán dễ thực hiện vì DL mang

tính định tính và thể hiện bằng tỷ lệ phần trăm, trong khi đó so sánh hai trung bình

thường phải làm việc trên một bộ DL định lượng và càng khó khăn hơn nếu cỡ mẫu

khảo sát quá lớn hoặc quá nhỏ. Nếu cỡ mẫu quá lớn thì phải tốn kém về thời gian và

kinh phí thực hiện khảo sát, tốn thời gian để nhập và phân tích DL nhưng có lợi ở

chỗ DL hầu như có PPC hoặc phân phối xấp xỉ chuẩn theo định lý giới hạn trung

tâm - điều kiện cần thiết của các phép KĐ TK và phân tích tương quan định lượng,

…. Ngược lại, nếu cỡ mẫu quá nhỏ thì ít tốn kém về thời gian và kinh phí khảo sát,

phân tích DL nhưng DL có thể không tuân theo PPC nên rất dễ sai lầm trong phân

tích TK, Câu khẳng định của GV: “So sánh hai trung bình là bài toán tương đối phổ

biến trong TK y học” muốn nhắc nhở SV về mức độ phổ biến và tầm quan trọng của

bài toán so sánh hai trung bình.

Cả hai biến ngẫu nhiên u có PPC và t có phân phối Student đều đã được học

trong chương “Các phân phối xác suất thường dùng” và chương “Lý thuyết ước

lượng” của giáo trình V1 nên SV đều đã quen thuộc với các bài toán liên quan đến

hai phân phối này.

GV nhấn mạnh về tầm quan trọng của bước đặt giả thuyết TK đặc biệt là giả

0H (giả thuyết không), giả thuyết

AH (giả thuyết thay thế khi

0H bị bác bỏ)

thuyết

156

0H . Trong bài toán KĐ giả thuyết TK,

mặc định là giả thuyết hai đuôi, đối lập với

0H

bước đặt giả thuyết rất quan trọng vì kết quả bác bỏ hay không bác bỏ giả thuyết

sẽ ảnh hưởng đến kết luận cuối cùng của một nghiên cứu trong y học. Đối với SV,

họ đã được học các phép KĐ giả thuyết khi so sánh hai tỷ lệ ở bài học trước nên đến

bài học này họ đã nắm được các bước thực hiện bài toán KĐ trong đó có bước đặt

giả thuyết TK. Điều này thể hiện ở trong cách hiểu và cách trả lời của SV: “Bước 1

là quan trọng nhất vì nếu đặt giả thuyết sai thì sẽ dẫn đến kết luận sai”. Họ cũng

trình bày cách đặt giả thuyết TK giống như những gì đã được học trong bài mở đầu

về KĐ giả thuyết TK: “Mình phải đặt giả thuyết với mục đích bác bỏ, giả thuyết

này phải đặt ngược với mục đích nghiên cứu, giả thuyết này gọi là giả thuyết không,

tức là không có sự khác biệt.”

Khi GV yêu cầu SV trình bày rõ hơn về cách đặt giả thuyết TK và nêu câu

hỏi: “Làm sao mình biết giả thuyết mình đặt là đúng hay sai” thì SV đã thể hiện sự

Ví dụ ở bài học trước, để so sánh hiệu quả của hai phương pháp điều trị bệnh A ta so

sánh tỷ lệ khỏi bệnh của hai phương pháp này bằng phép kiểm u. DL thu thập được

cho thấy tỷ lệ khỏi bệnh của hai phương pháp là khác nhau, muốn chứng tỏ điều này

mình đặt giả thuyết

0H đối lập với DL thực tế: Tỷ lệ khỏi bệnh của hai phương pháp

. Nếu chấp nhận

không khác nhau, tức là

p≠ 2

:H p 0 1

p= 2

:AH p 1

0H thì kết

luận hiệu quả của hai phương pháp như nhau và nếu bác bỏ

0H thì kết luận

ngược lại”.

lúng túng và trả lời câu hỏi này bằng cách đưa ra một ví dụ đã được học:

Trước khi bước vào nội dung chính của bài học, GV thực hiện pha thể chế hóa

để khẳng định lại về những nội dung đã thảo luận.

• Đoạn 9 chính là thời điểm gặp gỡ đầu tiên với kiểu nhiệm vụ Ttb2: Lựa chọn

phép kiểm và tính các giá trị TK. Thời điểm này diễn ra thông qua lời giới thiệu

Trong buổi học hôm nay, chúng ta sẽ tập trung nghiên cứu lý thuyết và thực hành giải

bài toán 1: So sánh hai trung bình thực nghiệm độc lập. Để so sánh hai trung bình ta

sử dụng 2 phép kiểm là u và t.

của GV:

157

Câu hỏi của GV “Vấn đề đặt ra là làm thế nào để so sánh trung bình của hai

dân số?” là câu hỏi quen thuộc với SV, vì họ đã có phương pháp so sánh hai tỷ lệ

của dân số trong bài học trước. Điều khác biệt trong bài học này là “so sánh hai

trung bình của dân số”

• Đoạn 10 là thời điểm nghiên cứu kiểu nhiệm vụ Ttb2. GV đóng vai trò chủ

động trong thời điểm này. GV là người đặt câu hỏi và cũng là người trả lời: “Đương

nhiên là chúng ta không thể khảo sát toàn bộ hai dân số đó để tính ra số trung bình

của đặc tính cần nghiên cứu. Các em đã học phương pháp của TK rồi, đó là: Xác

định cỡ mẫu, tiến hành lấy mẫu và sử dụng phương pháp KĐ giả thuyết TK để so

sánh hai trung bình”.

Cụ thể là ta phải lấy hai mẫu độc lập từ hai dân số đó và so sánh hai trung bình thực

nghiệm này để kết luận cho hai trung bình dân số. Để thực hiện điều này ta chia bài

toán thành 2 trường hợp: đã biết σ và chưa biết σ”

GV cũng gợi mở một kỹ thuật để giải quyết kiểu nhiệm vụ Ttb2:

Ttb2 là kiểu nhiệm vụ toán học vì để giải quyết kiểu nhiệm vụ này cần phải tính

toán các giá trị TK u hoặc t dựa vào các tham số TK như cỡ mẫu, trung bình,

phương sai. Những tính toán này không khó để thực hiện bằng máy tính bỏ túi

nhưng đòi hỏi SV phải cẩn thận và tính toán chính xác vì kết quả của các tính toán

t

này sẽ ảnh hưởng đến kết luận cuối cùng của bài toán.

2 u tbτ và 2

2 tbτ đều 2

• Đoạn 11, 12 là thời điểm làm việc với kỹ thuật. Hai kỹ thuật

được GV đưa vào để giải quyết hai tình huống thông qua hai ví dụ minh họa cho hai

Tương tự trong bài toán ước lượng khoảng tin cậy, σđã biết khi đã có nghiên cứu về

đặc tính X mà chúng ta đang quan tâm hoặc trong y văn đã công bố rồi. Chẳng hạn,

quyển sách Các giá trị sinh học người Việt Nam bình thường thập kỷ 90 - Thế kỷ XX

cho biết chiều cao trung bình của nam thanh niên Việt Nam trên 18 tuổi là 163 cm và

độ lệch chuẩn là 4 cm. Trong trường hợp này, khi nghiên cứu về chiều cao của nam

thanh niên Việt Nam chúng ta có thể coi như σ = 4 đã biết. Ngược lại, những nghiên

cứu mới thì chưa biết σ.

trường hợp đã biết phương sai và chưa biết phương sai:

158

t

2 u tbτ và 2

2 2

tbτ được vận hành khá tốt, đúng theo các bước đã được

Hai kỹ thuật

nêu ra: Đặt giả thuyết, tính các giá trị TK của u hoặc t tương ứng với trường hợp đã

biết phương sai hoặc chưa biết phương sai, cuối cùng là đưa ra kết luận dựa vào quy

0H . Việc tính toán các giá trị của

tắc quyết định bác bỏ hay không bác bỏ giả thuyết

u và t được thực hiện khá nhanh chóng với sự hỗ trợ của máy tính bỏ túi.

Vấn đề đáng chú ý là khi trình bày lý thuyết, trong bước đặt giả thuyết TK,

GV chỉ giới thiệu giả thuyết chính là giả thuyết hai đuôi, không trình bày giả thuyết

:AH µ µ≠

:H µ µ= 1 2

0

1

2

+

2)

một đuôi: “Đặt giả thuyết và ”. Các giá trị ngưỡng cố định

t n ( α 1

n 2

như 1,96 và 2,58 trong phép kiểm u hoặc trong phép kiểm t tương ứng

với mức sai lầm loại 1 là các giá trị ngưỡng hai đuôi. Điều này phù hợp với quan hệ

thể chế R(IV, O) mà chúng tôi đã phân tích trong chương 4 và cũng phù hợp với hai

ví dụ mà GV minh họa ngay sau đó.

t

2 u tbτ và 2

2 2

tbτ . Thời điểm này diễn ra sôi nổi nhất vì SV rất quan tâm đến điều kiện

• Đoạn 13 - 20 là thời điểm xây dựng môi trường công nghệ, lý thuyết cho

Khi sử dụng phép kiểm t, tại sao trong lý thuyết có yêu cầu muốn so sánh được hai

trung bình thì phải giả sử

?

2 σ σ= 2

2 1

thực hiện của hai phép kiểm, đặc biệt là phép kiểm t:

Thực ra nếu SV chú ý kỹ phần lý thuyết thì sẽ thấy được 2 điều kiện của phép

Ta muốn sánh hai số trung bình

,µ µ của hai dân số A và B có phân phối chuẩn,

1

2

2

2

phương sai lần lượt là

1σ và

2σ chưa biết. Muốn so sánh được thì ta phải giả sử

.

2 σ σ= 2

2 1

kiểm t, đó là: Hai dân số A và B có PPC và hai phương sai phải đồng nhất.

Để trả lời câu hỏi nêu trên, GV không giải thích lí do tại sao phải có giả thiết

2 σ σ= 2

2 1

mà khẳng định rằng: “Đó là điều kiện của phép kiểm t, nó cũng giống như

điều kiện của phép kiểm u và Chi bình phương mà các em đã học trong bài

trước đó”.

GV cũng đưa ra giải pháp để kiểm tra điều kiện hai phương sai đồng nhất, đó là sử

dụng phép kiểm F. Tuy nhiên, vì phép kiểm này chưa được học nên coi như điều

159

kiện phương sai đồng nhất đã thỏa mãn và như vậy SV không cần kiểm tra điều này

trong ví dụ về phép kiểm t đã trình bày: “bài học này chúng ta chưa có công cụ

nhưng trong bài học sau về phép kiểm F, chúng ta sẽ học phương pháp so sánh hai

phương sai bằng phép kiểm F”. Phép kiểm F dùng để so sánh hai phương sai mà

=

F

GV nhắc tới được thực hiện rất đơn giản vì giá trị của F là tỷ số của phương sai lớn

2 s 1 2 s 2

và phương sai nhỏ của hai mẫu DL ( , theo V1, tr.172-173) nên sẽ hợp lí hơn

nếu V1 đưa phép kiểm này vào trước bài học so sánh hai trung bình và GV dạy

phép kiểm F trước các phép kiểm u và t.

Việc so sánh hai phương sai có thể dẫn đến kết luận hai phương sai không

đồng nhất. Khi đó phải giải quyết bài toán so sánh hai trung bình bằng phép kiểm t

như thế nào? Trong các ví dụ và bài tập của V1, DL đều cho ở dạng thỏa mãn các

điều kiện của phép kiểm t. Chúng tôi dự đoán nếu cho một bài toán mà DL hai mẫu

có phương sai không đồng nhất, tức là vi phạm điều kiện của phép kiểm t, thì có thể

sẽ có sai lầm xảy ra vì với kỹ thuật hiện có mà giáo trình và GV cung cấp, SV luôn

mặc định điều kiện này đã thỏa mãn. Điều này thể hiện trong giờ học khá rõ khi mà

ở đó GV không trình bày trường hợp DL vi phạm điều kiện phương sai không đồng

nhất khi thực hiện phép kiểm t và cũng không có SV nào hỏi thêm về trường hợp

này. Đây là một sự khác biệt giữa tri thức bác học với tri thức trong chương trình và

giáo trình cũng như tri thức được dạy.

Điều kiện DL có PPC có thể được giải thích bằng định lý giới hạn trung tâm

khi cỡ mẫu khảo sát lớn hơn 30, trong trường hợp ngược lại thì sử dụng phép kiểm

chi bình phương. Cả hai kiến thức này đã được học trong các bài học trước nhưng

hầu như nó là một bài toán độc lập không liên quan đến kiểu nhiệm vụ Ttb2

trong bài học này. Trước đó SV cũng không biết thực hiện KĐ sự phù hợp của DL

với PPC để làm gì vì bài toán KĐ sự phù hợp của DL là một ví dụ trong số nhiều ví

dụ minh họa cho các ứng dụng của phép kiểm chi bình phương mà không có mục

đích nào khác.

160

Cũng cần phải nhắc lại rằng, phép kiểm chi bình phương mà SV đã học trong

bài học trước chỉ thực hiện được khi DL đã ghép lớp, trong trường hợp DL “thô”

hoặc bài toán không cho DL mà chỉ cho các giá trị về cỡ mẫu, trung bình, phương

sai thì không thể thực hiện bằng phép kiểm chi bình phương. Mặt khác phép kiểm

chi bình phương phải tính toán rất nhiều, nhất là việc tính giá trị XS cho từng lớp

DL để tính tần số lý thuyết, nên nếu cho thời gian ít thì SV không thể hoàn thành

được yêu cầu này.

Mặc dù giáo trình V1 và GV không công bố, nhưng nếu dùng các kỹ thuật

khác nhau để kiểm tra sự phù hợp của DL với PPC trong các ví dụ và bài tập của

V1 thì điều kiện này hoàn toàn thỏa mãn.

Như vậy, điều kiện DL có PPC của phép kiểm t có được GV nhắc đến trong

phần lý thuyết (dù không tường minh). Tuy nhiên, nó không được SV nhìn nhận

như một điều kiện bắt buộc của phép kiểm t, vì như phân tích ở trên thì DL trong

các ví dụ và bài tập đều đã thỏa mãn điều kiện này. Hơn nữa nếu thực hiện KĐ bằng

phép kiểm chi bình phương thì thời gian thực hiện khá lâu, nếu không thực hiện

được bằng phép kiểm chi bình phương (khi cho DL thô hoặc không cho DL mà chỉ

cho các thông số cần thiết như cỡ mẫu, trung bình, phương sai) thì hiện tại SV cũng

chưa có kỹ thuật nào khác. Điều đó cho phép chúng tôi củng cố giả thuyết

nghiên cứu

• Đoạn 21-22 là thời điểm làm việc với đối thuyết HA phát biểu ở dạng “một

bên” (µ > µ’ hoặc µ < µ’). Chính SV là người nêu vấn đề khi câu hỏi của bài toán

không chỉ là “kết luận” chung chung. Nếu có sự khác biệt về trung bình giữa hai

Câu hỏi của cả hai ví dụ vừa rồi là so sánh sự khác biệt của hai giá trị trung bình, nếu

có sự khác biệt thì ta cần biết trung bình nhóm nào lớn hơn. Chẳng hạn, trong ví dụ 2

câu hỏi là: “Hàm lượng Na+ trong máu người có huyết áp cao có cao hơn so với

người có huyết áp bình thường không?” thì làm sao?

nhóm, muốn đánh giá cụ thể hơn thì phương pháp KĐ là gì:

Theo lý thuyết KĐ giả thuyết TK, để kết luận về hàm lượng trung bình Na+

của nhóm nào cao hơn cần phải sử dụng phép kiểm một đuôi. Nhưng GV đã bỏ qua

161

cơ hội khiến SV thấy được sự cần thiết của phép kiểm một đuôi và nghiên cứu thêm

một kỹ thuật khác để bổ sung cho tổ chức toán học liên quan đến Ttb2 còn được xây

dựng chưa đầy đủ trong V1. Cách xử lý của GV ở đây là vẫn dùng phép kiểm

Chúng ta vẫn làm như bình thường và dẫn đến kết luận bác bỏ giả thuyết H0 , tức là sự

khác biệt về hàm lượng Na+ trung bình trong máu người có huyết áp cao và người có

huyết áp bình thường có ý nghĩa. Mặt khác ta thấy trong thực nghiệm, trung bình về

hàm lượng Na+ trong máu người có huyết áp cao lớn hơn người có huyết áp bình

thường. Từ đó có thể trả lời được câu hỏi của bạn.

hai đuôi:

Từ câu hỏi của SV và phân tích của GV, có thể thấy SV được phép dùng phép

kiểm hai đuôi để giải quyết mọi tình huống so sánh trung bình của hai nhóm: khác

nhau, cao hơn, thấp hơn trong các bài toán KĐ giả thuyết TK.

Phân tích trên đây cho phép khẳng định sự tồn tại của giả thuyết khoa học thứ

nhất (Giả thuyết 1): Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép

giải thích sai lầm của SV:

R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so

sánh hai trung bình thực nghiệm độc lập.

R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung

bình thực nghiệm độc lập.

Trong bài học hôm nay các em đã biết giải quyết bài toán so sánh hai trung bình thực

nghiệm độc lập. Các bước thực hiện của bài toán này cũng giống như thực hiện bài

toán so sánh hai tỷ lệ. Điều khác biệt chỉ là điều kiện áp dụng của các phép kiểm u và

t, chúng ta cần chú ý để sử dụng phép kiểm phù hợp với yêu cầu của mỗi bài toán.

• Đoạn 23 là thời điểm thể chế hóa:

Thời điểm này diễn ra nhanh chóng vì trong các bước của bài toán KĐ giả

thuyết TK chỉ có phần kiểm tra điều kiện áp dụng là có sự khác biệt đối với mỗi

phép kiểm, các bước khác hầu như đã quen thuộc đối với SV. Trong thời điểm thể

chế hóa, GV có nhắc đến việc sử dụng phép kiểm u hoặc t cho phù hợp nhưng

không nhắc đến phép kiểm một đuôi. Phải chăng là vì phép kiểm này không được

162

đưa vào chương trình và giáo trình ? Ứng xử của GV được quan sát cho thấy ảnh

hưởng khá mạnh của quan hệ thể chế lên quan hệ cá nhân của GV.

• Đoạn 24 là thời điểm đánh giá: GV đánh giá về kỹ thuật, đồng thời GV cũng

khẳng định kỹ thuật đưa vào chưa đầy đủ và cần phải tìm hiểu thêm để giải quyết

Mặc dù chưa bao quát hết các yêu cầu của mỗi bài toán nhưng kỹ thuật KĐ giả thuyết

TK mà chúng ta đã được học trong bài học này cơ bản đã giải quyết các tình huống mà

sau này chúng ta phải đối mặt. Nếu có thời gian các em nên tham khảo thêm các tài

liệu được liệt kê ở phần cuối của giáo trình để tìm hiểu thêm về KĐ giả thuyết TK”.

các tình huống khác với những tình huống quen thuộc mà SV đã được học:

5.2. THỰC NGHIỆM KIỂM CHỨNG GIẢ THUYẾT KHOA HỌC

Chúng tôi nhắc lại ở đây giả thuyết khoa học đã được rút ra khi phân tích quan

hệ thể chế R(IV, O) ở chương 4:

Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép giải

thích sai lầm của SV:

R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so

sánh hai trung bình thực nghiệm độc lập.

R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung

bình thực nghiệm độc lập.

5.2.1. Mô tả thực nghiệm

Chúng tôi phát cho SV đề bài (gồm hai bài toán). SV làm việc cá nhân để giải

hai bài toán này với thời gian 90 phút, sau đó chúng tôi thu lại bài làm để phân tích.

Bài toán 1: Kết quả XN nồng độ HbA1c (%) trên hai nhóm:

Nhóm 1: Gồm 27 bệnh nhân bị tiểu đường type 2:

6.4, 6.4, 5.4, 6.0, 6.2, 8.1, 1.6, 7.1, 7.4, 6.1, 7.2, 7.2, 6.6, 7.9, 6.5, 6.8, 8.4, 7.5, 6.6,

7.7, 5.9, 7.6, 7.3, 10.6, 6.6, 6.1, 5.6.

Nhóm 2: Gồm 27 người bình thường (không bị tiểu đường):

5.1, 5.3, 5.0, 5.5, 5.5, 5.7, 5.4, 5.6, 5.4, 5.1, 5.3, 6.2, 5.9, 5.1, 5.3, 5.8, 5.9, 6.0, 6.2,

5.3, 5.4, 5.0, 5.1, 5.3, 6.9, 5.9, 5.6.

Câu hỏi: Nồng độ HbA1c của những người bị tiểu đường (nhóm 1) có cao

hơn nồng độ này ở những người bình thường không (nhóm 2)? (α =0,05)

163

Bài toán 2: Một nghiên cứu nhằm so sánh nồng độ lysozyme giữa hai nhóm

bệnh nhân. Nhóm 1 gồm 29 bệnh nhân, nhóm 2 gồm 30 bệnh nhân tuổi từ 20 đến

60. Số liệu như sau: (Nguyễn Văn Tuấn, 2010)

Nhóm 1: 0.2, 0.3, 0.4, 1.1, 2.0, 2.1, 3.3, 3.8, 4.5, 4.8, 4.9, 5.0, 5.3, 7.5, 9.8,

10.4, 10.9, 11.3, 12.4, 16.2, 17.6, 18.9, 20.7, 24.0, 25.4, 40.0, 42.2, 50.0, 60.0.

Nhóm 2: 0.2, 0.3, 0.4, 0.7, 1.2, 1.5, 1.5, 1.9, 2.0, 2.4, 2.5, 2.8, 3.6, 4.8, 4.8, 5.4,

5.7, 5.8, 7.5, 8.7, 8.8, 9.1, 10.3, 15.6, 16.1, 16.5, 16.7, 20.0, 20.7, 33.0.

Câu hỏi: So sánh nồng độ Lysozyme trung bình trong hai nhóm trên (α

=0,05)

Cả hai bài toán được chúng tôi thiết kế ở đó các các dấu hiệu của tình huống

quen thuộc không còn được đảm bảo. Đây là các tình huống ngắt quãng hợp đồng

vì:

- DL mà chúng tôi đưa ra không có PPC.

- Phương sai hai mẫu không đồng nhất trong mỗi tình huống.

- Yêu cầu của bài toán 1 không còn thích hợp với phép kiểm hai đuôi, nó phù

hợp với phép kiểm một đuôi (Betty R. Kirkwood, 2003)

Để KĐ tính chuẩn của DL, phương pháp đơn giản nhất là vẽ biểu đồ tần số.

Nếu DL có PPC thì tần số cao nhất tập trung ở giữa và thấp dần về hai bên. Ngoài

ra, có thể dùng các phương pháp khác như: phép kiểm chi bình phương, phép kiểm

Kolmogorov-Smirnov khi cỡ mẫu n > 50, phép kiểm Shapiro-Wilk khi cỡ mẫu

n ≤ 50. (Nguyễn Ngọc Rạng, 2012)

Trong thể chế IV, KĐ tính chuẩn của DL là một bài toán độc lập và được thực

hiện bởi phép kiểm chi bình phương. Đây không phải là việc bắt buộc khi giải quyết

kiểu nhiệm vụ Ttb2, vì để thực hiện phép kiểm chi bình phương phải chia DL thành

từng lớp, dẫn đến sai số khi tính toán. Mặt khác, phép kiểm chi bình phương rất

phức tạp và mất nhiều thời gian tính toán nên nó đã bị bỏ qua trong các ví dụ và bài

tập của giáo trình V1.

5.2.2. Phân tích tiên nghiệm

5.2.2.1. Các chiến lược có thể

164

• S1: dùng phép kiểm t một đuôi mà không KĐ tính chuẩn của DL

+

(

(

1)

n 1

2 s 2

=

=

Đặt giả thuyết H0: µ1 = µ2; HA: µ1 > µ2

2 2 σ σ σ 2

2 1

2 s 1 +

n 2 − 2

1) n 1

n 2

2

x 1

x

=

t

n+

=

− ) 2 2

2 σ

+

1 n 1

1 n 2

  

  

n+

~ Student( 1 n

2α( 1 n

− ) 2 2

Miền bác bỏ H0 là t > C = t

• S2: dùng phép kiểm t một đuôi, có KĐ tính chuẩn của DL

- KĐ tính chuẩn của DL bằng phép kiểm chi bình phương, Shapiro-Wilk hoặc dựa

vào biểu đồ tần số;

- Thực hiện giống S1 nếu DL có PPC;

- Nếu DL không có PPC: Kết luận không thể so sánh hai trung bình bằng phép kiểm

t. Trong trường hợp này cần phải hoán chuyển DL về PPC hoặc sử dụng các phép

kiểm phi tham số.

• S3: dùng phép kiểm t hai đuôi mà không KĐ tính chuẩn của DL

1;

n+

- Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2 - Tính t như chiến lược S

− ) 2 2

- Miền bác bỏ H0 là | t | > C = tα ( 1 n

• S4: dùng phép kiểm t hai đuôi có KĐ tính chuẩn của DL

- KĐ tính chuẩn của DL bằng phép kiểm chi bình phương hoặc dựa vào biểu đồ tần

số.

- Thực hiện giống S3

5.2.2.2. Biến didactic

Những biến sau đây đã được chúng tôi tính đến khi xây dựng các bài toán

thực nghiệm:

• Biến V1: Cách đặt câu hỏi.

165

Cách đặt câu hỏi ở bài toán 1 phù hợp với phép kiểm một đuôi vì muốn đánh

giá xem nồng độ HbA1c trong nhóm 1 có cao hơn trong nhóm 2 hay không.

Còn trong bài toán 2, phép kiểm hai đuôi là phù hợp vì yêu cầu của bài toán là

đánh giá sự khác biệt về nồng độ lysozyme hay không của hai nhóm, không yêu cầu

trả lời nhóm này có cao hơn hoặc thấp hơn nhóm kia không.

• Biến V2: Bản chất của DL. Biến này có hai giá trị

- V2.1.: DL tuân theo PPC

- V2.2.: DL không tuân theo PPC

Trong cả hai bài toán, chúng tôi đều chọn biến V2.2: DL không tuân theo PPC.

Trong bài toán 1, dù SV có KĐ hay không KĐ tính chuẩn của DL thì kết quả

của tình huống vẫn đúng vì kết quả phép kiểm t phù hợp với kết quả của các phép

kiểm phi tham số (không cần điều kiện DL có PPC). Tuy nhiên, ở bài toán 2 nếu SV

không KĐ tính chuẩn của DL mà thực hiện ngay phép kiểm t sẽ cho ra kết luận sai.

Trong trường hợp này, SV phải thực hiện hoán chuyển DL để đưa DL về PPC hoặc

sử dụng phép kiểm phi tham số khi DL không tuân theo PPC. Các phép kiểm phi

tham số chỉ nên dùng khi không thể hoán chuyển được DL theo PPC vì nhược điểm

của các phép kiểm này là khả năng tìm ra sự khác biệt kém, không mạnh như các

phép kiểm có tham số.

Việc hoán chuyển DL về PPC hoặc sử dụng phép kiểm phi tham số không

được trình bày trong giáo trình V1 nên nếu DL không có PPC, SV sẽ hoặc là vẫn

thực hiện phép kiểm t như đã nói trên và cho kết luận sai hoặc là kết luận DL không

thỏa điều kiện của phép kiểm t nên không thể so sánh được hai trung bình.

3.1: Phương sai đã biết

• Biến V3: Phương sai dân số, có hai giá trị

3.2: Phương sai chưa biết

- V - V

Nếu phương sai đã biết thì dùng phép kiểm u, nếu phương sai chưa biết thì

dùng phép kiểm t để so sánh hai trung bình.

Trong cả hai bài toán này, chúng tôi đều chọn biến V3.2: Phương sai chưa biết.

166

5.2.3. Phân tích tiên nghiệm bài toán 1

Bài toán này được thiết kế để KĐ giả thuyết khoa học đã nêu. Chúng tôi chọn

biến V2.2.: DL không tuân theo PPC. Chúng tôi muốn biết SV có KĐ tính chuẩn của

DL hay không trước khi thực hiện phép kiểm t. Nếu SV không KĐ tính chuẩn mà

thực hiện ngay phép kiểm t sẽ cho phép khẳng định quy tắc R1 của giả thuyết 1.

Ngoài ra, để trả lời câu hỏi của bài toán 1 “Nồng độ HbA1c (%) của những người bị

tiểu đường có cao hơn nồng độ này ở những người bình thường không?”, phép

kiểm một đuôi là phù hợp. Nếu SV không chú ý đến điều này mà thực hiện phép

kiểm hai đuôi sẽ cho phép chúng tôi khẳng định quy tắc R2 của giả thuyết 1.

Các lời giải có thể quan sát được tương ứng với mỗi chiến lược

1X = 7,14; S1 = 1,379; n1 = 27 và

2X = 5,548; S2 = 0,444; n2 = 27

Các tham số thống kê như sau:

Lời giải tương ứng với chiến lược S1:

+

(

1)

(

n 1

2 s 2

=

=

Đặt giả thuyết: H0: µ1 = µ2; HA: µ1 > µ2

2 2 σ σ σ 2

2 1

2 s 1 +

n 2 − 2

1) n 1

n 2

x 2

=

t

= = 1,049

2 σ

+

1 n 1

1 n 2

x 1   

  

Nếu H0 đúng thì = 5,71. Vì t > C = t0,1(52) = 1,695 nên bác bỏ

H0.

Kết luận: Nồng độ HbA1c của nhóm 1 cao hơn nhóm 2 có ý nghĩa.

Lời giải tương ứng với chiến lược S2:

- Dựa vào biểu đồ cột (hình 5.1 và hình 5.2) ta thấy DL không có hình dạng

PPC, DL bị lệch, cột cao nhất không tập trung ở giữa và thấp dần về hai bên.

Những thông tin này cho ta biết nồng độ HbA1c không tuân theo PPC vì thế

không thể dùng phép kiểm t để so sánh hai trung bình.

- Sử dụng phép kiểm Shapiro-Wilk để KĐ tính chuẩn của DL. Kết quả cho

thấy DL về nồng độ HbA1c của hai nhóm không có PPC (p < 0,05). Biểu đồ tần số

bị lệch về một phía (xem hình 5.1 và 5.2).

167

Hình 5.1. Biểu đồ nồng độ HbA1c, nhóm 1

Hình 5.2. Biểu đồ nồng độ HbA1c, nhóm 2

Vì DL của X1 và X2 đều không tuân theo PPC nên không thể dùng phép kiểm

t để so sánh hai trung bình. Trong trường hợp này có thể hoán chuyển DL về PPC

hoặc sử dụng phép kiểm phi tham số Wilcoxon bằng phần mềm R để KĐ giả thuyết

như sau:

H0: Không có sự khác biệt về nồng độ HbA1c trong hai nhóm trên;

H1: Nồng độ HbA1c trong nhóm 1 cao hơn nhóm 2.

168

wilcox.test(X1, X2)

Wilcoxon rank sum test with continuity correction

data: X1 and X2

W = 680.5, p-value = 4.623e-08

alternative hypothesis: true location shift is not equal to 0 Vì p < 0,05 nên có cơ sở để bác bỏ H 0

Kết luận: Nồng độ HbA1c trong nhóm 1 cao hơn nhóm 2

Cũng có thể SV vẫn KĐ tính chuẩn của DL bằng phép kiểm chi bình phương

1.

nhưng tính toán sai dẫn đến kết luận DL tuân theo PPC và tiếp tục dùng phép kiểm t một đuôi để so sánh hai trung bình như chiến lược S

Lời giải tương ứng với chiến lược S3:

+

(

1)

(

n 1

2 s 2

=

=

* Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2

2 2 σ σ σ 2

2 1

2 s 1 +

n 2 − 2

1) n 1

n 2

x 2

= = 1,049

=

t

A(52) = 2 nên bác bỏ HR0R.

A0,05A

+

2 σ

1 n 1

1 n 2

x 1   

  

A E = 5,71. Vì |t| > C = tE Nếu H0 đúng thì

1X > 2X .

Kết luận: Nồng độ HbA1c của nhóm 1 cao hơn nhóm 2 do

Lời giải tương ứng với chiến lược SR4R:

- KĐ tính chuẩn của DL như chiến lược SR2 Rvà kết luận DL không tuân theo PPC

nên không thể so sánh hai trung bình trong trường hợp này.

- Cũng có thể, SV KĐ tính chuẩn của DL bằng phép kiểm chi bình phương

nhưng tính toán sai nên kết luận DL có PPC và thực hiện tiếp phép kiểm t hai đuôi

3E

như chiến lược SA

* Nhận xét về các chiến lược trong bài toán 1:

Chúng tôi dự đoán, chiến lược SR3R xảy ra nhiều nhất. Các chiến lược còn lại

không hoặc ít xảy ra vì khi phân tích R(IRVR, O) cũng như việc triển khai các tổ chức

toán học trên lớp không có kiểu nhiệm vụ KĐ tính chuẩn của DL trước khi thực

169

hiện phép kiểm t để so sánh hai trung bình, phép kiểm một đuôi cũng ít có cơ hội

xuất hiện trong thể chế IRV

5.2.4. Phân tích tiên nghiệm bài toán 2

Bài toán này cũng được thiết kế để kiểm chứng tính đúng đắn của giả thuyết

nghiên cứu đã nêu. Trong bài toán này, chúng tôi chọn biến VR2.2.R: DL không có

PPC. Do đó, nếu SV không KĐ tính chuẩn của DL mà thực hiện ngay phép kiểm t

sẽ cho ra kết luận sai. Chúng tôi dự đoán sai lầm này rất dễ xảy ra vì đây là bài toán

quen thuộc với SV, nó tương tự các ví dụ và bài tập về kiểu nhiệm vụ TRtb2R trong

giáo trình V1 mà ở đó chúng tôi không tìm thấy kiểu nhiệm vụ KĐ tính chuẩn của

DL trước khi thực hiện phép kiểm t. Việc KĐ tính chuẩn của DL xuất hiện trong bài

toán về những ứng dụng của phép kiểm chi bình phương, nó tồn tại độc lập, không

có liên hệ đến phép kiểm t.

Đây là bài toán KĐ hai đuôi và phép kiểm phù hợp nhất là phép kiểm t hai

đuôi. Cách đặt câu hỏi của bài toán tạo điều kiện cho sự xuất hiện của các chiến

lược SR3R và SR4R.

Các lời giải có thể quan sát tương ứng với mỗi chiến lược

Bài toán này phù hợp với phép kiểm hai đuôi vì chỉ yêu cầu so sánh có sự

khác biệt hay không về nồng độ lysozyme giữa hai nhóm bệnh nhân, không yêu cầu

so sánh nhóm này cao hơn hoặc thấp hơn nhóm kia nên chúng tôi dự đoán chỉ xuất

hiện chiến lược SR3R và S R4R.

=

=

=

=

=

=

=

=

30;

X

7,683;

61,62;

7,849

29;

X

14,31;

247,766;

15,74

n 2

2

2 s 2

s 2

n 1

1

2 s 1

s 1

* Lời giải tương ứng với chiến lược SR3

+

(

1)

(

n 1

2 s 2

=

=

Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2

2 2 σ σ σ 2

2 1

2 s 1 +

n 2 − 2

1) n 1

n 2

x 2

= =153,05

=

t

A0,05E(57) = 2,01 nên bác bỏ

+

2 σ

1 n 1

1 n 2

x 1   

  

A = 2,056. Vì |t| > C = tE Nếu H0 đúng thì

H0. Kết luận: Nồng độ Lysozyme của hai nhóm khác nhau có ý nghĩa.

170

Nhận xét: Lời giải này sai do DL không có PPC.

* Lời giải tương ứng với chiến lược S4

1 và X

2 phép kiểm Shapiro-Wilk có p < 0,05, biểu đồ

- KĐ tính chuẩn của X

nồng độ lysozyme bị lệch về phía trái (hình 5.3 và hình 5.4) nên có thể kết luận DL

không có PPC.

Hình 5.3. Biểu đồ nồng độ lysozyme nhóm 1

Hình 5.4. Biểu đồ nồng độ lysozyme nhóm 2

171

Hình 5.5. DL hoán chuyển Y1 = ln(X1)

Hình 5.6. DL hoán chuyển Y2 = ln(X2)

Khi DL không tuân theo PPC, ta có hai cách sau:

Cách 1: Hoán chuyển DL sang logarith (cơ số e): Y1 = ln(X1) và Y2 = ln(X2)

KĐ tính chuẩn của DL sau khi hoán chuyển có kết quả như sau:

shapiro.test(Y1)

Shapiro-Wilk normality test

data: Y1

W = 0.938, p-value = 0.08868

shapiro.test(Y2)

Shapiro-Wilk normality test

172

data: Y2

W = 0.9555, p-value = 0.2372

Kết quả KĐ cho thấy, p > 0,05 nên có thể kết luận DL sau khi hoán chuyển có

PPC (hình 5.5 và hình 5.6)

Đặt giả thuyết H0: µ1 = µ2; HA: µ1 ≠ µ2

Khi đó, giá trị của t là 1,406, với kết quả này ta chưa đủ cơ sở để bác bỏ H0, tức là

nồng độ lysozyme ở hai nhóm khác nhau không ý nghĩa.

Cách 2: Dùng KĐ phi tham số Wilcoxon

Giả thuyết KĐ: H0: Nồng độ lysozyme ở hai nhóm khác nhau không ý nghĩa.

Wilcoxon rank sum test with continuity correction

data: X1 and X2

W = 541, p-value = 0.1096

alternative hypothesis: true location shift is not equal to 0

Vì p > 0,05 nên chưa đủ cơ sở để bác bỏ H0.

Kết luận: Nồng độ lysozyme ở hai nhóm khác nhau không ý nghĩa.

- Có thể SV dùng phép kiểm chi bình phương để KĐ tính chuẩn của DL nhưng

3.

tính toán sai dẫn đến kết luận DL có PPC và tiếp tục dùng phép kiểm t để so sánh hai trung bình như chiến lược S

Nhận xét Qua phân tích chương trình và giáo trình chúng tôi có thể dự đoán

trong bài toán 2, chỉ có chiến lược S3 xuất hiện. Có rất ít (hoặc không có) chiến

lược S4 vì các ví dụ và bài tập trong giáo trình V1 không yêu cầu SV phải KĐ tính

chuẩn của DL trước khi thực hiện phép kiểm t mặc dù điều kiện DL có PPC được

trình bày trong giáo trình V1 ở phần lí thuyết phép kiểm t.

Kết quả của chiến lược S3 hoàn toàn khác với câu trả lời mong đợi vì SV

không KĐ tính chuẩn của DL trước khi thực hiện phép kiểm t.

5.2.5. Phân tích hậu nghiệm

Thực hiện tiến hành trên 349 SV năm thứ hai ngành Bác sĩ đa khoa (6 năm) và

ngành Dược (5 năm) sau khi vừa học xong chương “Kiểm định giả thuyết thống kê”

Bảng 5.1 là kết quả TK các bài toán trong thực nghiệm:

173

Bảng 5.1. Kết quả TK các chiến lược được sử dụng

Bài toán Tổng số

3 S 4

1 S S

Chiến lược 2 S

1 0 0 349 0 349

2 0 0 349 0 349

Kết quả thực nghiệm này cho thấy 349/349 (100%) SV sử dụng chiến lược S3:

Sử dụng phép kiểm t hai đuôi không KĐ tính chuẩn của DL. Không có SV nào chú

ý đến điều kiện DL phải có PPC trong cả hai bài toán. Hơn nữa, trong bài toán 1,

mặc dù phép kiểm t một đuôi là phù hợp nhưng cũng không có SV nào thực hiện

phép kiểm t một đuôi. (Một số bài giải của SV có trong Phụ lục 4)

Kết quả thực nghiệm đã cho phép kiểm chứng giả thuyết khoa học

(giả thuyết 1) đã nêu.

5.3. KẾT LUẬN CHƯƠNG 5

Trong chương này chúng tôi đã tiến hành hai thực nghiệm trên hai đối tượng

GV và SV. Thực nghiệm thứ nhất: phân tích thực hành DH của GV qua việc phân

tích cấu trúc của tổ chức toán học được xây dựng trong lớp học và sự liên hệ của

các tổ chức toán học, phân tích các tổ chức didactic mà GV đã triển khai để truyền

bá các tổ chức toán học thông qua 6 thời điểm nghiên cứu.

Kết quả phân tích thực nghiệm thứ nhất cho thấy, liên quan đến kiểu nhiệm vụ

t

Ttb2 còn tồn tại một tổ chức toán học không đầy đủ về mặt kỹ thuật mà GV đã triển

tbτ đo GV đưa vào

2 2

khai trên lớp học. Sự thiếu hụt này thể hiện ở chỗ: kỹ thuật

không bao hàm việc KĐ tính đồng nhất của phương sai và tính chuẩn của DL - điều

kiện tiên quyết của phép kiểm t. Kết quả này cũng phù hợp với kết quả phân tích

quan hệ thể chế R(IV, O) mà chúng tôi đã thực hiện trong chương 4.

Ở thực nghiệm thứ hai, trên đối tượng SV, chúng tôi cũng đã kiểm chứng tính

đúng đắn của giả thuyết khoa học:

174

Giả thuyết 1: Tồn tại hai quy tắc R1, R2 sau đây của hợp đồng DH cho phép

giải thích sai lầm của SV:

R1: SV không có trách nhiệm kiểm tra tính chuẩn của DL khi KĐ giả thuyết so

sánh hai trung bình thực nghiệm độc lập.

R2: SV luôn sử dụng phép kiểm hai đuôi khi KĐ giả thuyết so sánh hai trung

bình thực nghiệm độc lập.

Để làm đầy tổ chức toán học nói trên và kiểm chứng giả thuyết khoa học (giả

thuyết 1) trên một đối tượng SV khác, chúng tôi sẽ xây dựng một đồ án DH và triển

khai trên lớp học. Đây cũng là nội dung mà chúng tôi sẽ thực hiện ở chương 6.

175

CHƯƠNG 6

CÁC GIẢI PHÁP SƯ PHẠM VÀ NGHIÊN CỨU THỰC NGHIỆM

A. GIẢI PHÁP SƯ PHẠM

6.1. CƠ SỞ ĐỀ XUẤT GIẢI PHÁP

6.1.1. Cơ sở lí luận

Các giải pháp sư phạm được đề xuất trước hết dựa trên xu hướng tích cực hóa

hoạt động học tập của người học. Xu hướng này được hình thành từ Thuyết kiến

tạo, theo đó:

tri thức được tạo nên một cách tích cực bởi chủ thể nhận thức chứ không -

phải tiếp thu thụ động từ bên ngoài.

- nhận thức là quá trình thích nghi và tổ chức lại thế giới quan của mỗi người

thông qua các hoạt động đồng hóa và điều ứng những tri thức và kinh

nghiệm sẵn có của mình để thích nghi với môi trường.

- việc học xẩy ra trong hoạt động và thông qua hoạt động.

Những gì trình bày ở Chương 1 của luận án cho thấy Didactic và Thuyết kiến

tạo đều có chung quan điểm này về việc học. Theo quan điểm ấy, việc học chỉ xẩy

ra khi người học chủ động, còn người dạy tạo được môi trường sao cho tri thức cần

dạy mang lại một giải pháp tối ưu.

Một cơ sở lý luận khác là khái niệm mô hình hóa (toán học) và vai trò của nó

trong việc xây dựng nghĩa của tri thức.

Ngoài ra, cơ sở để đề ra các giải pháp còn là những kết quả nghiên cứu mà

chúng tôi đã trình bày ở các chương trước. Cụ thể là :

6.1.2. Kết quả phân tích tri thức luận

- Vai trò của XS – TK trong các nghiên cứu y học, trong chẩn bệnh và

điều trị.

- Vai trò của PPC trong KĐ giả thuyết TK.

- Các kỹ thuật cần biết để giải bài toán KĐ nói chung, bài toán KĐ giả

thuyết về so sánh hai trung bình thực nghiệm độc lập nói riêng.

176

6.1.3. Kết quả phân tích quan hệ thể chế, quan hệ cá nhân

- Sự thiếu hụt kỹ thuật KĐ giả thuyết TK về so sánh hai trung bình thực

nghiệm độc lập, sự vắng mặt đối thuyết « một đuôi » (µ < µ’ hoặc µ > µ’)

để giải quyết nhiều vấn đề thực tiễn.

- Sai lầm của SV sinh ra từ những lựa chọn của thể chế.

6.2. CÁC GIẢI PHÁP SƯ PHẠM

6.2.1. Giải pháp 1: Cấu trúc lại chương trình đào tạo của các trường đại học Y

Như chúng tôi đã trình bày trong phần mở đầu của luận án, môn học XS-TK ở

các trường đại học y dược được đưa vào giảng dạy ngay từ học kì I của năm thứ

nhất. Ở năm học này SV y khoa chưa có nhiều kiến thức về y học nên GV khó có

thể truyền đạt những ứng dụng của XS-TK đến SV, phục vụ cho mục đích nghiên

cứu y học và ứng dụng cho nghề nghệp của họ sau khi tốt nghiệp. Mặt khác, ở nước

ta chưa có sự kết hợp giữa người làm TK và người sử dụng TK: nhà TK học sử

dụng TK cho sự phát triển nội tại của khoa học TK, người sử dụng TK làm việc độc

lập trong việc ứng dụng các công cụ của XS-TK trong nghiên cứu y học. Điều này

dẫn đến các nghiên cứu của TK học chưa có tính thực tiễn trong khi các nghiên cứu

có tính thực tiễn như nghiên cứu y học thì vẫn còn có những sai sót không đáng có.

Để khắc phục nhược điểm này chúng tôi đề nghị:

Nhà thiết kế chương trình cần thiết kế lại khung chương trình XS-TK để đưa

vào giảng dạy khi SV đã có một số kiến thức về y, dược học. Chẳng hạn, môn học

XS – TK có thể dạy ở học kì II của năm thứ năm cho hệ đào tạo 6 năm, năm thứ ba

cho hệ đào tạo 4 năm. Vào năm cuối, SV sẽ phải tiến hành các nghiên cứu nhỏ, viết

các báo cáo khoa học, viết luận văn tốt nghiệp. Và điều quan trọng là kiến thức Y –

Dược học đã có sẽ là môi trường cho phép loại bỏ những chiến lược sai mà SV

phạm phải.

6.2.2. Giải pháp 2: Khai thác kết quả phân tích tri thức luận để tổ chức lại các kiến

thức trong chương trình và giáo trình

Chương trình, giáo trình phải làm cho SV thấy rõ vai trò của XS – TK trong

chẩn bệnh và điều trị, phải coi trọng hơn nhiệm vụ bồi dưỡng năng lực nghiên cứu,

177

khả năng đọc hiểu và biết phê phán các công trình thuộc lĩnh vực Y – Dược học. Về

điều này, phân tích của chúng tôi cho thấy các thể chế IF, IA đặc biệt quan tâm.

Các loại đối thuyết, các phép kiểm một đuôi, các điều kiện thực hiện mỗi phép

kiểm, các bước của mỗi kỹ thuật, … phải được giới thiệu đầy đủ cho SV.

6.2.3. Giải pháp 3: Khai thác công nghệ thông tin vào việc học XS - TK

Cần dạy cho SV một số phần mềm như SPSS, R, Epi Info, ... Các phần mềm

này mang lại những công cụ hiệu quả để phân tích TK, xử lí được những bộ DL cỡ

lớn, chuẩn hóa DL khi nó chưa có PPC, v.v....

6.2.4. Giải pháp 4: Thiết kế một website như một bệnh viện ảo

SV có thể thực hiện tất cả các khâu của một quá trình nghiên cứu y học, từ thu

thập DL, phân tích TK, kết luận, viết bài báo. Bệnh viện ảo này là một bước thử

nghiệm nhằm khắc phục những khó khăn khi SV tiếp cận với bệnh viện thật hoặc

phải làm việc trên những bộ DL giả định mà những bộ DL này ít nhiều có tính chủ

quan của người viết giáo trình nhằm minh họa cho các kiến thức được giảng dạy

trong chương trình chứ chưa có tính thực tiễn.

6.2.5. Giải pháp 5: Xây dựng các tình huống học tập trong đó tồn tại một môi

trường để hoạt động đồng hóa và điều tiết của SV xẩy ra

Các hoạt động đồng hóa và điều tiết này có thể gắn liền với quá trình mô hình

hóa toán học. Môi trường phải cho phép SV loại bỏ hay hợp thức hóa những chiến

lược giải quyết vấn đề, những kiến thức cần SV thu nhận được.

Đồ án DH mà chúng tôi xây dựng dưới đây là một ví dụ minh họa cho các giải

pháp đã đề xuất.

B. THỰC NGHIỆM

Trong phần này chúng tôi sẽ thiết kế một đồ án DH minh họa cho những giải

pháp đã đề xuất. Tri thức cần dạy ở đây là các phương pháp KĐ giả thuyết về so

sánh hai trung bình. Mục đích của đồ án là tạo môi trường cho SV nhận ra sai lầm

và từ đó làm đầy hơn các tổ chức toán học liên quan đến kiểu nhiệm vụ so sánh hai

trung bình thực nghiệm độc lập. Tuy nhiên, yếu tố môi trường cho phép nhận ra sai

178

lầm trong đồ án của chúng tôi không phải tự nó có, mà phải do các pha trong đồ án

tạo ra. Lý do của sự lựa chọn này nằm ở chỗ SV tham gia thực nghiệm là SV năm

thứ nhất của Đại học Y dược Tp HCM – họ chưa có những kiến thức y học cần thiết

để nhận ra sai lầm của mình.

Như chúng tôi đã nêu trong Chương 1, việc nghiên cứu một đồ án DH gồm

các pha:

- Nghiên cứu tri thức cần dạy qua các phân tích tri thức luận và phân tích

thể chế

- Xây dựng đồ án: xác định vấn đề sẽ đưa ra cho người học nghiên cứu, dàn

dựng kịch bản, phân tích tiên nghiệm và xác định DL cần thu thập, hiện

tượng cần quan sát.

- Triển khai đồ án trong lớp học, tổ chức quan sát trên lớp học

- Phân tích hậu nghiệm để xem có hợp thức hóa (nội tại) được hay không

những gì đã dự kiến khi xây dựng đồ án.

6.3. NHỮNG KẾT QUẢ CHỦ YẾU RÚT RA TỪ PHÂN TÍCH TRI THỨC

LUẬN VỀ KĐ GIẢ THUYẾT TK

Đối tượng tri thức được quan tâm ở đây là phép kiểm t - phép KĐ giả thuyết

liên quan đến việc so sánh hai số trung bình thực nghiệm độc lập. Vấn đề so sánh

này có mặt thường xuyên trong các nghiên cứu y học.

Trong các nghiên cứu này người ta thường phải KĐ một trong hai loại giả

thuyết sau:

- Sự khác biệt giữa hai số trung bình là không có ý nghĩa

- Số trung bình này lớn hơn số trung bình kia

Đối với trường hợp thứ nhất người ta dùng phép kiểm hai đuôi. Trong trường

hợp thứ hai, phép kiểm một đuôi là cần thiết.

Nghiên cứu tri thức luận của chúng tôi còn chỉ ra rằng PPC là một công cụ

trung tâm của các phân tích TK. Tính chuẩn của DL là điều kiện cần để giải quyết

các bài toán KĐ giả thuyết TK một cách thỏa đáng, nếu không thì kết quả nhận

được không đáng tin cậy.

179

Như vậy, việc kiểm tra tính chuẩn của DL là một bước quan trọng trong kỹ

thuật giải quyết kiểu nhiệm vụ Ttb2: so sánh hai trung bình thực nghiệm độc lập.

Thế nhưng, trong thể chế IV mà chúng tôi quan tâm - thể chế DH XS-TK ở

trường Đại học Y Dược Tp HCM, tổ chức toán học xây dựng quanh kiểu nhiệm vụ

t

Ttb2 lại có những thiếu hụt về kỹ thuật. Sự thiếu hụt đó thể hiện ở hai điểm. Thứ

tbτ được đưa vào trong thể chế không bao gồm việc kiểm tra hai

2 2

nhất, kỹ thuật

điều kiện sau của phép kiểm t :

- phương sai đồng nhất

- DL có PPC.

t

Thứ hai, loại giả thuyết « số trung bình này lớn hơn số trung bình kia » không được

tbτ sử dụng phép kiểm một đuôi không được đưa

1 2

đề cập đến. Cụ thể hơn, kỹ thuật

vào, dù nó rất cần thiết cho việc giải quyết Ttb2.

Phân tích thể chế đã dẫn chúng tôi tới giả thuyết khoa học (giả thuyết 1) cho

phép giải thích những sai lầm mà SV phạm phải khi đối diện với Ttb2.

Một đồ án đã được xây dựng và triển khai để bổ sung cho quan hệ thể chế và

tác động vào quan hệ cá nhân của SV đối với bài toán KĐ giả thuyết TK.

6.4. XÂY DỰNG ĐỒ ÁN

Với mục đích khắc phục những khiếm khuyết về kỹ thuật của tổ chức toán học

liên quan đến Ttb2 đã được xây dựng trong thể chế IV và kiểm chứng các giả thuyết

khoa học đã đặt ra, chúng tôi thiết kế một đồ án DH kiểm định giả thuyết thống kê.

Phân tích trên đã dẫn chúng tôi đến việc chọn PPC và phép kiểm một đuôi làm đối

tượng làm việc trong đồ án này.

6.4.1. Các bài toán cơ sở của đồ án

Đồ án được xây dựng trên cơ sở hai bài toán sau (phiếu số 1 trong Phụ lục 7):

Bài toán 1: Lượng PSA (X1 ng/ml) của một mẫu 44 người bị ung thư tiền liệt tuyến

có di căn như sau:

6.0, 7.3, 8.5, 8.9, 9.5, 11.9, 10.2, 11.3, 11.5, 11.4, 11.2, 12.5, 12.9, 13.0, 14.0, 13.8,

12.9, 14.8, 15.0, 15.5, 15.8, 15.7, 16.0, 15.0, 16.0, 16.2, 17.1, 18.0, 17.8, 16.9, 16.5,

17.4, 17.9, 18.5, 19.4, 19.6, 18.7, 18.3, 21.0, 22.5, 26.0, 29.1, 25.6, 25.8

180

2 ng/ml) của 27 người bị ung thư tiền liệt tuyến chưa di căn như sau:

Lượng PSA (X

8, 9, 9.1, 9.2, 9.5, 9.8, 10.7, 10.8, 11.2, 11.7, 11.8, 12.3, 12.5, 12.9, 13, 14, 14.5,

14.7, 15.5, 16, 16.4, 16.9, 17, 18, 19.1, 21, 21.8

Hỏi: Lượng PSA của người ung thư tiền liệt tuyến có di căn có cao hơn lượng

PSA của người ung thư tiền liệt tuyến chưa di căn không? (α = 0,05)

Bài toán 2: Nồng độ HbA1c của 28 người bị đái tháo đường type 2 :

12.2, 8.2, 5.9, 6.1, 8.3, 9.5, 6.3, 9.3, 7.5, 6.6, 7.8, 6.3, 7.7, 7.3, 6.5, 5.5, 6, 14.9, 7.5,

8.3, 7.4, 8.8, 12, 7.9, 10.9, 6.1, 5.1, 7.8

Nồng độ HbA1c của 30 người bình thường (không bị đái tháo đường) :

8.1, 5.3, 5.0, 5.8, 9.5, 5.4, 10.0, 4.5, 8.8, 5.9, 6.2, 10.3, 7.1, 7.5, 9.2, 4.3, 8.8, 7.1,

6.4, 7.5, 7.3, 4.3, 10.1, 6.7, 9.3, 4.8, 5.8, 7.3, 8.2, 4.9

Hỏi: Nồng độ HbA1c của người bị đái tháo đường type 2 có cao hơn nồng độ

này ở người bình thường không? (α = 0,05).

6.4.2. Dàn dựng kịch bản

Đồ án được cấu tạo từ hai buổi học với đối tượng SV năm thứ nhất khi vừa

học xong chương KĐ giả thuyết TK.

Buổi 1: nhằm mục đích kiểm chứng lại giả thuyết khoa học thứ nhất với đối tượng

SV khác (hệ cử nhân - 4 năm).

SV làm việc cá nhân tại lớp trong 60 phút. Nhiệm vụ của họ là giải hai bài toán 1 và

2. Cả hai bài toán đều thuộc kiểu nhiệm vụ Ttb2 - so sánh hai trung bình thực

t

nghiệm độc lập. Đây là một kiểu nhiệm vụ quen thuộc đối với SV. Tuy nhiên, như

tbτ mà thể chế đưa vào chỉ cho câu trả lời đúng khi phương sai

2 2

đã nói, kỹ thuật

t

đồng nhất và DL có PPC, điều luôn luôn thỏa mãn trong tất cả những bài tập SV đã

tbτ thực hiện phép kiểm một đuôi

1 2

gặp. Hơn thế, trong những bài tập ấy, kỹ thuật

không

can thiệp.

181

Với hai bài toán 1 và 2, chúng tôi đã đặt SV vào trong tình huống phá vỡ hợp

đồng. Nếu SV bị chi phối bởi giả thuyết 1 thì họ sẽ cho câu trả lời sai, không phù

hợp với kiến thức y học.

Buổi 2: nhằm mục đích làm đầy cho tổ chức toán học liên quan đến Ttb2 đã

được xây dựng trong thể chế và kiểm chứng Giả thuyết 2: SV có thể nhận ra sai

lầm của mình thông qua hoạt động giải quyết các tình huống phá vỡ hợp đồng,

được thiết kế theo quan điểm của phương pháp DH tích cực, trong đó yếu tố môi

trường cho phép họ bác bỏ sự vận dụng một kỹ thuật ở ngoài phạm vi hợp thức

của nó.

Để tạo môi trường cho SV đặt ra câu hỏi về tính thỏa đáng của câu trả lời họ

đã đưa ra, chúng tôi sẽ cung cấp bài giảng của bác sĩ thông qua đoạn video và phiếu

thông tin y học. Vấn đề tìm nguyên nhân nảy sinh và những khiếm khuyết của kỹ

thuật đã biết sẽ được khắc phục.

Buổi học thứ hai này được thiết kế qua ba tình huống.

Tình huống 1 (75 phút) : Nghiên cứu bệnh đái tháo đường (bài toán 2)

Mục đích: Làm cho SV nhận ra sự cần thiết của hai điều kiện của phép kiểm t

và cung cấp thêm công cụ để kiểm định tính chuẩn của DL.

Tình huống 2 (55 phút) : Nghiên cứu bệnh ung thư tiền liệt tuyến (bài toán 1)

Mục đích: Giúp SV nhận ra sự cần thiết của phép kiểm một đuôi.

Tình huống 3 (40 phút) : Trở lại bài toán 2 (DL không có PPC)

Mục đích: Giải bài toán khi DL không có PPC và cung cấp kỹ thuật hoán

chuyển DL khi nó không có PPC.

6.4.3. Phân tích tiên nghiệm bài toán 1 và 2

6.4.3.1. Những chiến lược có thể

• S1: dùng phép kiểm t một đuôi không KĐ tính chuẩn của DL

• S2: dùng phép kiểm t một đuôi có KĐ tính chuẩn của DL

• S3: dùng phép kiểm t hai đuôi không KĐ tính chuẩn của DL

• S4: dùng phép kiểm t hai đuôi có KĐ tính chuẩn của DL

182

Đối với bài toán 1: DL đã cho có PPC và phương sai hai dân số đồng nhất nên

thỏa mãn điều kiện của phép kiểm t. Do đó SV có thực hiện hay không việc KĐ tính

chuẩn của DL thì đều không ảnh hưởng đến kết luận của bài toán. Tuy nhiên, với

A ta có thể dùng yếu tố Bayes (Sellke T., et al, 2001)

DL thu thập được và để trả lời câu hỏi trong cả hai bài toán thì phép kiểm một đuôi là câu trả lời đúng (chiến lược S2). Để đánh giá mức độ khả dĩ của hai giả thuyết H 0 và H

Đối với bài toán 2: DL không có PPC nên nếu SV không thực hiện KĐ tính

chuẩn của DL thì sẽ dẫn đến kết luận sai.

Do đó có thể khẳng định rằng chiến lược cho câu trả lời đúng ở hai bài toán

này là S2.

6.4.3.2. Biến didactic

• Biến V1: Cách đặt câu hỏi. Biến này có hai giá trị :

V1.1: Trung bình của hai nhóm có khác nhau không?

V1.2: Trung bình của nhóm 1 có cao hơn nhóm 2 không?

Chúng tôi muốn biết SV lựa chọn phép kiểm một đuôi hay hai đuôi để kiểm định

quy tắc R2 nên chọn biến V1.2 ở cả hai bài toán trong thực nghiệm này.

• Biến V2: Bản chất của DL. Biến này có hai giá trị

- V2.1: DL tuân theo PPC

- V2.2: DL không tuân theo PPC

Chúng tôi đã chọn giá trị V2.1 cho bài toán 1 và V2.2 cho bài toán 2.

Biến V3: Phương sai mẫu, có hai giá trị

V3.1: Phương sai hai mẫu không đồng nhất

V3.2 : Phương sai hai mẫu đồng nhất

Vì mục đích thực nghiệm chỉ liên quan đến PPC và phép kiểm một đuôi nên để đơn

giản hóa tình huống chúng tôi đã chọn giá trị V3.2 cho cả hai bài toán.

6.5. PHÂN TÍCH HẬU NGHIỆM

Buổi 1:

183

Chúng tôi phát cho SV phiếu số 1 (đề bài của hai bài toán, có trong Phụ lục 7),

SV làm việc cá nhân tại lớp trong 60 phút để giải hai bài toán KĐ giả thuyết TK.

Kết quả thu được trong bảng 6.1

184

Bảng 6.1. Kết quả thực nghiệm bài toán 1 và 2

Bài toán Chiến lược Tổng số

S1 S2 S3 S4

0 0 90 0 1 90

0 0 90 0 2 90

Kết quả thực nghiệm này cho thấy 90/90 (100%) SV sử dụng chiến lược S3:

dùng phép kiểm t hai đuôi không KĐ tính chuẩn của DL trong cả hai bài toán.

Ở bài toán 1, SV thực hiện KĐ giả thuyết và dẫn đến bác bỏ giả thuyết H0.

0 thì chỉ có thể kết luận "có sự khác biệt về nồng độ PSA ở hai nhóm"

Khi bác bỏ H

nhưng SV vẫn kết luận "lượng PSA của người bị ung thư tiền liệt tuyến di căn cao

hơn ở người chưa di căn" đúng như câu hỏi của bài toán 1.

Trong bài toán 2, SV sử dụng chiến lược S3 đã dẫn đến kết luận "lượng

HbA1c ở người đái tháo đường và ở người bình thường bằng nhau". Kết luận này

sai so với kết luận của bác sĩ trong video clip được chiếu trong giờ học "lượng

HbA1c ở người đái tháo đường cao hơn so với người bình thường".

Một số bài làm của SV có trong Phụ lục 4, biên bản buổi học được trình bày

trong Phụ lục 5.

Kết quả thu được ở đây một lần nữa cho phép chúng tôi khẳng định tình thỏa

đáng của giả thuyết khoa học thứ nhất về sự tồn tại của hai quy tắc R1, R2 (đã được

kiểm chứng trong nghiên cứu thực nghiệm trình bày ở chương 5)

Buổi 2

6.5.1. Tình huống 1 : nghiên cứu bệnh đái tháo đường

Pha 1A:

- GV thông báo kết quả TK về câu trả lời cho bài toán 2 mà SV đã làm việc trong

buổi 1: trong số SV tính toán đúng thì 100% đều kết luận “Không có sự khác biệt về

nồng độ HbA1c của người đái tháo đường và người bình thường”.

t

- GV gọi một một SV lên trình bày lại các bước của bài toán đã giải, SV này viết

tbτ gồm 3 bước đã được học

2 2

trên bảng lời giải của bài toán theo đúng kỹ thuật

thông qua các ví dụ của giáo trình V1 sử dụng trong thể chế IV.

185

Lời giải của mọi SV tham gia thực nghiệm đều tương tự.

- GV chiếu đoạn video bài giảng về bệnh đái tháo đường do bác sĩ Lê Thanh Toàn

trình bày. SV chăm chú theo dõi và ghi lại những thông tin liên quan đến bệnh đái

tháo đường như:

Ở người bị đái tháo đường được chẩn đoán nhưng chưa điều trị thì nồng độ

HbA1c lớn hơn rất nhiều so với người bình thường.

Ở người bị bệnh đái tháo đường đã được điều trị thì nồng độ HbA1c sẽ trở về

mức bình thường hoặc gần như bình thường.

Pha 1B: Thảo luận về sự khác biệt giữa lời giải của bài toán và kết luận của bác sĩ.

SV làm việc theo nhớm hai người, mỗi nhóm có một máy vi tính đã được đánh

số thứ tự. Những gì họ thảo luận đều được ghi âm và sau đó được chúng tôi tái lập

lại thành biên bản cho từng nhóm. Những trích dẫn in nghiêng trong phân tích dưới

đây đều lấy ra từ các biên bản.

SV dễ dàng tìm ra sự mâu thuẫn giữa câu trả lời mà họ đã đưa ra cho bài toán 2 và

kiến thức y học thu được từ bài giảng này.

Máy 29:

- Mình trả lời là nó không khác nhau mà ở đây thì khác nhau.

- Cái này nó cao bất thường chăng?

- Theo bác sĩ thì nó khác nhau. Nguyên nhân khác nhau tại đâu?

Pha 1C: Tìm nguyên nhân sai lầm

Đầu tiên, SV xem lại các bước giải trong bài toán 2 và đi đến kết luận là đã

tính toán đúng, các bước không có gì sai:

Máy 29:

- Sai ở đâu, các bước mình tính đâu có gì sai đâu?

Máy 7:

- Bài giải thì đúng rồi, các bước đều đúng.

Sau khi kiểm tra lại các bước, SV cho rằng nguyên nhân của sai sót là : do mẫu nhỏ,

do chọn mẫu không ngẫu nhiên.

Máy 7:

186

- Có thể người ta chọn theo ý thích

- Chấp nhận giả thuyết không có nghĩa là giả thuyết đó đúng, phải tăng cỡ mẫu

lên để KĐ lại.

Có nhóm nghĩ đến điều kiện của phép kiểm t nhưng không nhớ rõ nên họ mở

giáo trình ra xem lại.

Máy 7:

- Điều kiện của phép kiểm t đó, nhớ không?

- Có điều kiện gì?

GV phân tích những ý kiến mà SV đưa ra:

- Cỡ mẫu cũng là yếu tố quan trọng trong nghiên cứu, nhưng ở đây ta chỉ có

mẫu DL này nên ta bỏ qua vấn đề cỡ mẫu.

- Các mẫu cũng được lấy một cách ngẫu nhiên theo tiêu chuẩn nghiên cứu và

lấy trong hai quần thể độc lập: người bị bệnh đái tháo đường và người bình

thường.

- Về vấn đề mức sai lầm α, theo các quy ước trong nghiên cứu y học, người ta

vẫn lấy mức α = 5% nên trong bài toán này, ta cũng thực hiện theo quy ước

đó.

Sau khi GV phân tích, SV tiếp tục thảo luận để tìm nguyên nhân. Nhiều nhóm

đưa ra các nguyên nhân khác, đúng với mong đợi của chúng tôi.

Máy 29:

- KĐ sự đồng nhất của phương sai đi

- Cả hai bài này hôm bữa mình làm hết rồi, phương sai đồng nhất rồi, đâu cần

làm nữa.

- Vậy nguyên nhân ở đâu?

- Nó có PPC không, chắc là do nguyên nhân này.

Máy 31:

- Các bài toán trong sách, DL xem như có PPC, còn ở đây chưa biết có PPC

hay không nên có sự khác biệt giữa kết luận của bác sĩ và bài giải.

- Giờ mình xem DL có PPC không.

187

Như vậy, SV đã nhận ra hai điều kiện cần thiết của phép kiểm t - DL có PPC

và phương sai đồng nhất.

Pha 1D : Kiểm tra hai điều kiện của phép kiểm t

GV đặt câu hỏi: “Sử dụng kỹ thuật nào để kiểm tra các điều kiện này?”. Hầu

hết các nhóm đều trả lời: Sử dụng phép kiểm F để KĐ tính đồng nhất của phương

sai và sử dụng phép kiểm chi bình phương để KĐ tính chuẩn của DL.

Máy 29:

Cái này sử dụng cái gì mà … phép kiểm chi bình phương hay sao đó

Là để xác định DL có PPC không thì mình dùng phép kiểm chi bình phương

Còn điều kiện phương sai đồng nhất thì sao?

Cái này dùng phép kiểm F thì đã đồng nhất rồi, mình đã kiểm rồi

Lý do SV nhanh chóng trả lời được câu hỏi này nằm ở chỗ đây là hai bài toán

KĐ đã được học. Tuy nhiên, hai bài toán này được xem xét từ trước một cách hoàn

toàn độc lập với việc nghiên cứu Ttb2.

GV gọi một SV lên bảng trình bày các bước của phép kiểm chi bình phương

trong bài toán KĐ tính chuẩn của DL. Thực hiện các bước này không khó với SV

nhưng thời gian thực hiện quá lâu. Hơn nữa, muốn thực hiện phép kiểm chi bình

phương thì phải đưa DL gốc về dạng bảng ghép lớp. Nhược điểm của bảng ghép lớp

là thông tin sẽ bị mất mát và đôi khi dẫn đến kết luận sai. Đa số SV đều biết các

nhược điểm này. Điều này thể hiện trong câu trả lời đồng thanh (“quá lâu”, “nửa

tiếng”) của SV khi GV đặt câu hỏi : “phép kiểm chi bình phương thực hiện có lâu

không? Trong khoảng bao nhiêu phút?”

GV phân tích về các nhược điểm của phép kiểm chi bình phương và đưa ra

một phương pháp KĐ tính chuẩn của DL thay thế phép kiểm chi bình phương nhằm

khắc phục nhược điểm này. Đó là phép kiểm Shapiro có sẵn trong phần mềm R.

Phần cuối của pha này, GV giới thiệu phần mềm R với hàm shapiro.test để

KĐ tính chuẩn của DL. SV hào hứng thực hiện công việc này và đưa ra kết luận DL

không có PPC một cách nhanh chóng.

Máy 24:

188

Không thực hiện được phép kiểm t vì hai mẫu DL không có cùng PPC

Như vậy, kết thúc pha này, SV đã tìm ra nguyên nhân sai lầm do DL không có

PPC. Tuy nhiên, họ không biết xử lý như thế nào, vì đây là một tình huống không

quen thuộc với họ.

6.5.2. Tình huống 2

Pha 2A

Cũng như pha 1A của tình huống 1, GV thông báo kết quả TK câu trả lời phổ

biến của SV: Trong số SV tính toán đúng thì 100% có kết luận là “Không có sự

khác biệt về nồng độ PSA của người bị Ung thư tiền liệt tuyến đã di căn và chưa di

căn”.

Để SV nhận ra câu trả lời này sai, GV cung cấp cho SV phiếu số 2 với tựa đề

“PSA và ung thư tiền liệt tuyến”. (Phụ lục 7)

Các nhóm tích cực thảo luận và nhận ra mâu thuẫn giữa thông tin trên phiếu số

2 với kết luận của bài toán mà họ đã đưa ra. Kết quả thảo luận được tóm tắt trên

giấy bài làm của SV:

Máy 38

- Trên thực tế, lượng PSA của người bị ung thư tiền liệt tuyến đã di căn cao hơn

so với người bị ung thư tiền liệt tuyến chưa di căn. Ở bài toán 1, kết luận

cuối cùng là lượng PSA của người bị ung thư tiền liệt tuyến đã di căn không

khác so với người bị ung thư tiền liệt tuyến chưa di căn. Tại sao có sự khác

nhau đó?

Máy 7

- Theo phiếu số 2 thì lượng PSA của người bị ung thư tiền liệt tuyến đã di căn

lớn hơn so với người bị ung thư tiền liệt tuyến chưa di căn. Nhưng bài toán

mình giải thì không có sự khác biệt.

Pha 2B: Tìm nguồn gốc sai lầm

Vì đã gặp một bài toán tương tự trong tình huống 1, nên sau khi thảo luận

nhóm, SV đã nhanh chóng khoanh vùng các nguyên nhân có thể dẫn đến sai lầm.

Máy 38

189

- Ta phải xem DL bài toán có thỏa các điều kiện sau không : Phương sai có đồng

nhất không? DL có PPC không? Hai mẫu có độc lập không?

- Phương sai đồng nhất đã kiểm tra rồi mà

Máy 23

- Có thể chỉ có hai nguyên nhân đó thôi, các bước đã đúng hết rồi.

Các nhóm tiếp tục kiểm tra hai điều kiện của phép kiểm t. Sau khi dùng phép

kiểm F thì thấy hai phương sai đồng nhất

Nếu như trong bài toán 4, DL không có PPC, thì ở đây tất cả các điều kiện của

phép kiểm t đều thỏa mãn: hai mẫu độc lập, phương sai đồng nhất, DL có PPC.

Chính vì vậy, SV bắt đầu thể hiện sự bối rối:

Máy 7 :

- Tất cả các điều kiện đều thỏa mãn rồi, vậy nguyên nhân ở đâu, T?

- Vậy chắc là có nguyên nhân nào khác nữa.

Kết thúc pha này, SV vẫn chưa tìm ra nguyên nhân sai lầm.

Pha 2C: Lựa chọn phép kiểm một đuôi hay hai đuôi.

GV đặt ra câu hỏi: Các bài toán trong giáo trình đều hỏi có sự khác biệt hay

không giữa hai đại lượng trung bình. Với câu hỏi đại lượng nào lớn hơn đại lượng

nào, phương pháp điều trị này có tốt hơn phương pháp điều trị kia không thì phải sử

dụng phép kiểm nào?

SV trả lời đồng thanh “một đuôi” vì họ đã có một ví dụ về phép kiểm u một

đuôi trong bài toán so sánh hai tỷ lệ. Họ cũng phân biệt được những tình huống sử

dụng phép kiểm một đuôi và hai đuôi. Tuy nhiên, phép kiểm này xuất hiện trong

giáo trình V1 còn rất mờ nhạt và hoàn toàn không được nói đến khi xem xét kiểu

nhiệm vụ Ttb2

Máy 29 :

- Mình đang làm là hai đuôi đúng không?

- Hai đuôi là nó có khác nhau hay không thôi, còn một đuôi là cái nào cao hơn

cái nào.

- Một đuôi có nói trong sách nhưng có chút xíu à.

190

Sau khi thảo luận nhóm, hầu hết các nhóm đều trả lời được lý do sử dụng phép

kiểm một đuôi.

Kết thúc pha này, SV nhận thấy sự cần thiết của phép kiểm một đuôi và lý do

sử dụng phép kiểm này nhưng chưa giải được bài toán 1 do SV chưa có kỹ thuật

thực hiện phép kiểm này.

Pha 2D: Giới thiệu phép kiểm một đuôi

GV trình bày phép kiểm một đuôi, minh họa bằng hình vẽ trên bảng :

t

Sau khi có kỹ thuật, SV làm việc nhóm để giải bài toán 1. Kết quả tính toán

tbτ thực hiện phép kiểm một đuôi vận hành khá tốt, các

1 2

của SV cho thấy, kỹ thuật

bước của kỹ thuật rất rõ ràng.

1 > µ 2

Đặt : H0 = µ

2; HA:µ

Máy 19

t =1,93, giá trị ngưỡng C = tE

A(69) = 1,667 ⇒ t > C : Bác bỏ HA 0E

A0,1A

A, chấp nhận HRA

Vậy lượng PSA của người Ung thư tiền liệt tuyến có di căn cao hơn lượng PSA của người

Ung thư tiền liệt tuyến chưa di căn.

A E

SV thực hiện các bước của phép kiểm t một đuôi và câu trả lời tìm được phù

hợp với kiến thức y học cung cấp: PSA của người bị Ung thư tiền liệt tuyến đã di

căn cao hơn PSA của người bị Ung thư tiền liệt tuyến chưa di căn.

6.5.3. Tình huống 3

Pha 3A: Xử lý DL khi DL không có PPC

GV nhắc lại DL bài toán 2 không có PPC nên chưa thể dùng phép kiểm t để so

sánh hai trung bình và giới thiệu 3 cách để xử lý DL trong trường hợp này

Cách 1: Tăng cỡ mẫu lên và KĐ DL sau khi tăng cho đến khi DL có PPC

Cách 2: Dùng các hàm toán học để hoán chuyển DL về PPC

Cách 3: Dùng các phép kiểm phi tham số để so sánh hai trung bình vì phép kiểm

này. không đòi hỏi điều kiện DL có PPC.

GV phân tích ưu, nhược điểm của từng phương pháp và đề nghị các nhóm

thực hiện theo cách 2: Hoán chuyển DL và làm mẫu một ví dụ sử dụng cách này

bằng hàm toán học Y = log(X)

191

Pha 3B: Kiểm tra hai điều kiện của DL sau hoán chuyển.

Đến pha này, SV đã biết rằng muốn thực hiện phép kiểm t cần phải kiểm tra

các điều kiện về tính đồng nhất của phương sai và tính chuẩn của DL.

Pha 3C: Giải bài toán 2 bằng phép kiểm t một đuôi

Đến pha này, SV cũng biết phải thực hiện phép kiểm t một đuôi đối với bài

toán 2 vì cần phải trả lời câu hỏi : “Nồng độ HbA1c của nhóm người bị đái tháo

đường có cao hơn người bình thường không”. Điều này thể hiện trong tất cả các bài

làm của các nhóm.

Kết thúc pha này, SV đưa ra kết luận phù hợp với kiến thức y học về bệnh đái

tháo đường mà bác sĩ đã trình bày trong đoạn video bài giảng.

Pha 3D : Thể chế hóa

- GV thể chế hóa các bước thực hiện kiểu nhiệm vụ TRtb2R: So sánh hai trung bình

thực nghiệm độc lập.

6.6. KẾT LUẬN CHƯƠNG 6

Trong chương này, chúng tôi cũng đã xây dựng một đồ án DH nhằm khắc

phục những khiếm khuyết của tổ chức toán học đã chỉ ra. Các mục tiêu của đồ án

DH đều đạt được: SV đã có ý thức trong việc kiểm tra các điều kiện của phép kiểm

t, biết cách xử lý tình huống khi các điều kiện này không thỏa mãn, biết sử dụng

phép kiểm một đuôi phù hợp với yêu cầu của mỗi bài toán. SV cũng biết sử dụng

thêm một công cụ hỗ trợ trong việc giải quyết các bài toán liên quan đến phép kiểm

t trong KĐ giả thuyết TK.

Các phân tích trong chương này cũng cho thấy, SV đã tự nhận ra sai lầm khi

giải các bài toán thực tế vì kết luận của các bài toán mà họ đưa ra không phù hợp

với những tri thức y học. Điều này cho phép chúng tôi khẳng định tính đúng đắn

của giả thuyết nghiên cứu thứ hai:

Giả thuyết 2: SV có thể nhận ra sai lầm của mình thông qua hoạt động giải quyết

các tình huống phá vỡ hợp đồng, được thiết kế theo quan điểm của phương pháp

DH tích cực, trong đó yếu tố môi trường cho phép họ bác bỏ sự vận dụng một kỹ

thuật ở ngoài phạm vi hợp thức của nó.

192

KẾT LUẬN CỦA LUẬN ÁN

1. Luận án đã thu được các kết quả chính sau đây:

- Trình bày một số công cụ lý thuyết của Didactic Toán như lý thuyết tình huống, lý

thuyết nhân chủng học, hợp đồng DH trong sự kết nối với quan điểm DH tích cực,

góp phần làm đa dạng kho tàng Lý luận và Phương pháp DH môn toán ở nước ta.

Đây cũng là những công cụ lí giải cho hầu hết cho các nghiên cứu trong luận án.

- Thực hiện một điều tra sơ bộ về những ứng dụng của XS-TK trong y học. Điều tra

này cho chúng ta thấy một cái nhìn toàn diện về những đóng góp của XS-TK trong

nghiên cứu y học, trong chẩn đoán, điều trị, phát triển các loại thuốc mới, các

phương pháp điều trị mới, …

- Phân tích một số sai lầm thường gặp trong các nghiên cứu y học có sử dụng XS-

TK, lí giải các nguyên nhân sai lầm, từ đó đề xuất phương pháp DH KĐ giả thuyết

TK và thể hiện qua một đồ án DH.

- Phân tích tri thức luận về quá trình hình thành, phát triển, vị trí, vai trò của KĐ giả

thuyết TK và PPC. Phân tích cho thấy những khó khăn, chướng ngại, thậm chí sai

lầm mà các nhà khoa học đã gặp phải trong quá trình khám phá và sử dụng PPC.

Phân tích cũng đã chỉ ra nhu cầu cần thiết của KĐ giả thuyết TK, các bài toán mà

KĐ giả thuyết TK có thể giải quyết, các phương pháp KĐ TK như KĐ ý nghĩa của

Fisher và KĐ giả thuyết của Pearson - Neyman, mô hình KĐ giả thuyết TK hỗn hợp

ứng dụng trong y học mà tiêu biểu là nghiên cứu lâm sàng đối chứng ngẫu nhiên.

- Phân tích quan hệ thể chế R(IRVR, O), R(IRFR, O) và R(IRAR,O) bằng quan điểm so sánh.

Phân tích đã chỉ ra những điểm giống và khác nhau giữa ba thể chế, các tổ chức

toán học liên quan đến O hiện diện trong chương trình, tìm ra các điểm tương đồng

và khác biệt giữa ba thể chế nhằm làm rõ mục đích, ý nghĩa của các tổ chức toán

học được đưa vào chương trình. Phân tích cũng cho thấy yếu tố đào tạo nghề trong

ba thể chế đã được thể hiện rõ thông qua việc giải quyết các nhiệm vụ của y học

như đánh giá các thuật điều trị, phát triển các loại thuốc, ứng dụng của XS-TK trong

điều trị và chăm sóc bệnh nhân, trong nghiên cứu y học.

193

Luận án cũng chỉ ra sự ảnh hưởng của lựa chọn thể chế đến hiệu quả đào tạo

XS-TK cho cán bộ y tế.

- Luận án đã kiểm chứng tính khả thi và hiệu quả của một đồ án DH KĐ giả thuyết

TK từ quan điểm DH tích cực.

Toàn bộ những kết quả trên đây cho thấy nhiệm vụ nghiên cứu của luận án đã

được hoàn thành, giả thuyết khoa học đặt ra trong luận án đã được khẳng định.

2. Nghiên cứu mở ra từ luận án

Nghiên cứu ảnh hưởng của mối quan hệ thể chế với một số tri thức XS-TK

trong y học tại trường Đại học Y, thuộc Đại học Grenoble, cộng hòa Pháp. Triển

khai một đồ án DH XS-TK tại đại học này, trên cơ sở đó đánh giá và so sánh về

hiệu quả của đồ án đã thực hiện tại Đại học Y dược Tp.HCM.

194

DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ

1. Đào Hồng Nam (2010), Mối quan hệ thể chế với phân phối chuẩn trong việc dạy

và học xác suất thống kê ở Trường Đại Học Y Dược Tp. HCM, Tạp chí Khoa

học, Trường Đại học Sư phạm Tp.HCM, số 24.

2. Đào Hồng Nam (2011), Phân tích thực hành hoạt động giảng dạy của giảng viên

qua tiết học về mô hình ngưỡng, Tạp chí Khoa học, Trường Đại học Sư phạm

Tp. HCM, số 28.

3. Đào Hồng Nam (2012), Lợi ích của phân tích tri thức luận trong dạy học xác

suất thống kê - Một phân tích tri thức luận về phân phối chuẩn, Tạp chí Khoa

học, Trường Đại học Sư phạm Tp.HCM, số 33

4. Đào Hồng Nam (2012), Nghiên cứu sai lầm của người học từ cách tiếp cận của

"Hợp đồng dạy học", Tạp chí Khoa học, Trường Đại học Sư phạm Tp.HCM,

số 34.

5. Đào Hồng Nam (2013), Đồ án didactic – một nghiên cứu thực nghiệm về dạy học

phân phối chuẩn trong kiểm định giả thuyết thống kê, Tạp chí Khoa học,

Trường Đại học Sư phạm Tp.HCM, số 45.

6. Lê Thị Hoài Châu, Đào Hồng Nam, Une étude sur la pratique d’enseignement

des probabilités dans la formation des medecins. Actes EMF 2012 (Espace

Mathématique Francophones), Genève.

7. Đào Hồng Nam (2013), Test d’hypothèse statistique. Une ingénierie didacticque.

Actes du Colloque International Franco-Vietnamien en Didactique des

Mathématiques, Ho Chi Minh ville du 02 au 04 janvier 2013.

8. Lê Thị Hoài Châu, Đào Hồng Nam (2013), Statistics and probability teaching for

medicine and pharmacy, International Conference on Mathematical Research,

Education and Applications, ICMREA – UEL 2013, HCMC.

195

DANH MỤC TÀI LIỆU THAM KHẢO

A. Tiếng Việt

1. Nguyễn Thị Tân An (2013), "Mô hình hóa toán học trong dạy học xác suất -

thống kê ở trường phổ thông", Hội thảo quốc tế Didactic và Phương pháp

dạy học Toán, Tp.HCM.

2. Trần Túy An (2007), Nghiên cứu thực hành giảng dạy khái niệm xác suất trong

các lớp song ngữ và các lớp phổ thông Việt Nam, Luận văn thạc sĩ giáo dục

học, Đại học Sư phạm Tp.HCM.

3. Bessot A., Comiti C., Lê Thị Hoài Châu, Lê Văn Tiến (2009), Những yếu tố cơ

bản của Didactic Toán, NXB Đại học Quốc gia Tp.HCM.

4. Bessot A. (2013), "Một phân tích đối chiếu về hai giáo trình xác suất – thống kê

dành cho ngành Y ở Pháp và Việt Nam", Hội thảo quốc tế Didactic và

Phương pháp dạy học Toán, Tp.HCM.

5. Birebent A. (2013), "Những bài toán cơ bản nào và những đối tượng toán học nào

cho việc dạy thống kê ?", Hội thảo quốc tế Didactic và Phương pháp dạy học

Toán, Tp.HCM.

6. Comiti C., Lê Thị Hoài Châu (2011), "Những đóng góp của Thuyết nhân học đối

với việc phân tích giờ học trên lớp", Tạp chí Khoa học, Đại học Sư

phạm Tp.HCM, số 28.

7. Bộ giáo dục và đào tạo (2001), Chương trình đào tạo bác sĩ đa khoa, Hà Nội.

8. Bộ giáo dục và đào tạo (2012), Chương trình khung giáo dục đại học - khối

ngành Khoa học sức khỏe, Hà Nội.

9. Bộ môn Toán (2011), Chương trình khung về xác suất thống kê, Đại học Y dược

Tp.CM.

10. Lê Thị Hoài Châu (2001), Đề tài nghiên cứu khoa học cấp Bộ, mã số B2001-23-

02

11. Lê Thị Hoài Châu (2002), "Khoa học luận và Didactic", Tạp chí Khoa học, Đại

học Sư phạm Tp HCM, số 32.

196

12. Lê Thị Hoài Châu (2010a), "Những chướng ngại, khó khăn trong dạy học khái

niệm xác suất", Tạp chí Khoa học, Đại học Sư phạm Tp.HCM, số 24.

13. Lê Thị Hoài Châu (2010b), "Dạy học thống kê ở trường phổ thông và vấn đề

nâng cao năng lực hiểu biết toán cho học sinh", Tạp chí khoa học, Đại học

Sư phạm Tp. HCM, số 25.

14. Lê Thị Hoài Châu (2012), Dạy học xác suất - thống kê ở trường phổ thông, Nxb

Đại học Sư phạm Tp.HCM.

15. Lê Thị Hoài Châu, Đào Hồng Nam (2013), "Một nghiên cứu về thực hành dạy

học xác suất trong đào tạo thầy thuốc", Hội thảo quốc tế Didactic và Phương

pháp dạy học Toán, Tp.HCM.

16. Hồ Thị Ngọc Dung, Châu Ngọc Hoa, “ Nồng độ acid uric huyết thanh ở bệnh

nhân tăng huyết áp”, Y học Tp. Hồ Chí Minh, tập 13, số 6 năm 2009, tr.41-

17. Tăng Minh Dũng (2010), Dạy học thống kê trong đào tạo giáo viên, Luận văn thạc sĩ,

Đại học Sư phạm Tp.HCM.

46.

18. Trần Anh Dũng (2013), Dạy học khái niệm hàm số liên tục ở trường Trung học

phổ thông, Luận án tiến sĩ, Trường Đại học Sư phạm Tp.HCM.

19. Lê Trường Giang (2007), Thống kê y học, NXB y học, Hà Nội.

20. Hoàng Nam Hải (2013), Phát triển năng lực suy luận thống kê cho sinh viên cao

đẳng chuyên nghiệp, Luận án tiến sĩ, Trường Đại học Vinh.

21. Đỗ Hàm (2007), Phương pháp luận trong nghiên cứu khoa học y học, NXB y

học, Hà Nội.

22. Đặng Đức Hậu (2010), Xác suất thống kê (dùng cho đào tạo bác sĩ đa khoa),

Nxb Giáo dục Việt Nam, Hà Nội.

23. Tạ Hữu Hiếu (2010), Dạy học môn thống kê toán học theo hướng vận dụng

trong nghiên cứu khoa học cho sinh viên các trường đại học thể dục thể thao,

Luận án tiến sĩ, Trường Đại học Sư phạm Hà Nội.

197

24. Nguyễn Đức Hoàng, Lê Thanh Hải, Lê Chuyển, Hoàng Khánh, Huỳnh Đình

Chiến, Phan Thị Danh (2004), “Nghiên cứu nồng độ Homosysteine máu -

yếu tố nguy cơ mới ở bệnh nhân nhồi máu não cấp”,

www.thankinhhoc.com/HomocysteinBSHoang%201.pdf

25. Đặng Vũ Hoạt, Hà Thị Đức (2004), Lý luận dạy học đại học, Nxb Đại học Sư

phạm, Hà Nội.

26. Ngô Tất Hoạt (2011), Nâng cao hiệu quả dạy học xác suất thống kê ở trường

đại học sư phạm kỹ thuật theo hướng bồi dưỡng một số thành tố năng lực

kiến tạo kiến thức cho sinh viên, Luận án tiến sĩ, Trường Đại học Vinh.

27. Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), Thống kê toán học,

Nxb Đại học Quốc gia Hà Nội.

28. Đỗ Mạnh Hùng (1993), Nội dung và phương pháp dạy "một số yếu tố của lí

thuyết xác suất" cho học sinh chuyên toán bậc phổ thông trung học Việt

Nam, Luận án tiến sĩ, Viện Khoa học Giáo dục Việt Nam, Hà Nội.

29. Vũ Như Thư Hương (2005), Khái niệm xác suất trong dạy học toán ở trung học

phổ thông, Luận văn thạc sĩ giáo dục học, Trường Đại học Sư phạm

Tp.HCM.

30. Trần Lương Công Khanh (2013), "Các nghịch lý trong lý thuyết xác suất và tác

động của chúng đến dạy và học", Hội thảo quốc tế Didactic và Phương pháp

dạy học Toán, Tp.HCM.

31. Trần Kiều (1988), Nội dung và phương pháp dạy thống kê mô tả trong chương

trình toán cải cách ở trường phổ thông cơ sở Việt Nam, Luận án tiến sĩ, Viện

Khoa học Giáo dục Việt Nam, Hà Nội.

32. Nguyễn Bá Kim (2005), “Nghiên cứu dạy học toán và đổi mới phương pháp dạy

học toán”, Hội thảo lần thứ nhất về Didactic – Phương pháp dạy học môn

Toán, Trường Đại học Sư phạm Tp.HCM.

33. Trần Thị Mỹ Loan, Trương Quang Bình (2009), “Tương quan giữa chỉ số khối

cơ thể và rối loạn lipid máu ở bệnh nhân tăng huyết áp”, Y học Tp. Hồ Chí

Minh, tập 13, số 1, tr.61-66.

198

34. Nguyễn Phú Lộc (2007), Xu hướng dạy học không truyền thống, Trường Đại

học Cần Thơ.

35. NEY M. (2013), "Chương trình LOE cho việc học thống kê ở trường Y: một

quan điểm didactic", Hội thảo quốc tế Didactic và Phương pháp dạy học

Toán, Tp.HCM.

36. Cao Phi Phong (2005), "Mối quan hệ giữa tăng homocysteine huyết tương và

nhồi máu não", Y học Tp. Hồ Chí Minh, tập 9, số 1, năm 2005.

37. Nguyễn Ngọc Rạng (2012), Thiết kế nghiên cứu & thống kê y học, NXB y học,

Hà Nội.

38. Lê Quang Sơn, Nguyễn Văn Chung, Nguyễn Văn Sách (2009), “Nghiên cứu đặc

điểm gây mê hồi sức trong phẫu thuật nội soi ruột thừa có bơm thán khí vào

ổ bụng”, Y học Tp. Hồ Chí Minh, tập 13, số 1, năm 2009, tr.481-487

39. Đặng Đức Tâm (2013), “Kết quả cắt tuyến tiền liệt qua niệu đạo bằng Bipolar”,

Tạp chí y dược học quân sự, số 3, năm 2013.

40. Nguyễn Chí Thanh (2011), “Tìm hiểu giá trị nồng độ NT – Pro ANP, MR – Pro

AMD trong chẩn đoán và tiên lượng trên bệnh nhân suy tim”, Luận văn cao

học, trường ĐH Y Dược Cần Thơ.

41. Nguyễn Chí Thành, Bùi Anh Kiệt (2013), "Kiến thức về Xác suất và Thống kê

của sinh viên những năm đầu đại học: một số kết quả từ một điều tra bảng

hỏi", Hội thảo quốc tế Didactic và Phương pháp dạy học Toán, Tp.HCM.

42. Đặng Hùng Thắng (2010), Mở đầu về lí thuyết xác suất và các ứng dụng, Nxb

Giáo dục Việt Nam, Hà Nội.

43. Trần Văn Thạch (2005), “Hạ can-xi huyết trong kiềm hô hấp cấp”, Y học Tp. Hồ

Chí Minh, tập 9. Số 4, tr.224 - 227.

44. Chu Văn Thọ, Trần Đình Thanh, Nguyễn Văn Liêng (2008), Xác suất Thống kê,

Đại học Y dược Tp.HCM.

45. Chu Văn Thọ, Trần Đình Thanh, Nguyễn Văn Liêng (2012), Xác suất Thống kê,

Đại học Y dược Tp. HCM.

199

46. Chu Văn Thọ, Trần Đình Thanh, Nguyễn Văn Liêng (2012), Bài tập Xác suất

Thống kê, Đại học Y dược Tp. HCM.

47. Đỗ Thị Thanh Thủy, Nguyễn Thị Thanh Minh, Nguyễn Thị Hoàng Phương,

Phùng Như Toàn, Phạm Việt Thanh, Trương Đình Kiệt, Trần Thị Trung

Chiến (2009), “So sánh các thông số tầm soát trước sinh ở nhóm thai phụ

mang thai bình thường và nhóm thai phụ mang thai hội chứng Down”, Y học

Tp. Hồ Chí Minh, tập 13, số 1, tr.204-210.

48. Lê Văn Tiến (2005), Phương pháp dạy học môn toán ở trường phổ thông, Nxb

Đại học Quốc gia Tp.HCM.

49. Lê Văn Tiến (2006), “Sai lầm của học sinh nhìn từ góc độ các lý thuyết về học

tập”, Tạp chí giáo dục, số 137, kì 1-5/2006, Hà Nội.

50. Phan Thị Tình (2011), Tăng cường vận dụng toán học vào thực tiễn trong dạy

học môn xác suất thống kê và môn quy hoạch tuyến tính cho sinh viên toán

đại học sư phạm, Luận án tiến sĩ, Viện Khoa học Giáo dục Việt Nam, Hà

Nội.

51. Huỳnh Thị Thanh Trang, Huỳnh Nghĩa, Lê Bạch Lan, Phạm Thị Huỳnh Giao,

Trần Thị Kim Thanh, Nguyễn Văn Tiên, Lê Quốc Việt (2008), "Bước đầu

khảo sát tăng đông trên bệnh nhân huyết khối tắc mạch",

www.115.org.vn/DOC/bckh1.pdf

52. Phạm Văn Trạo (2009), Xây dựng và thực hiện chuyên đề chuẩn bị dạy học xác

suất - thống kê ở trung học phổ thông cho sinh viên toán Đại học sư phạm,

Luận án tiến sĩ, Viện Khoa học Giáo dục Việt Nam, Hà Nội.

53. Nguyễn Văn Tuấn (2004), Hai mặt sáng tối của y học hiện đại, NXB trẻ, Tp.

HCM.

54. Nguyễn Văn Tuấn (2007), Phân tích số liệu và vẽ biểu đồ R, NXB Khoa học và

Kỹ thuật, Hà Nội.

55. Nguyễn Văn Tuấn (2010), "Kiểm định t và hoán chuyển số liệu",

http://www.ykhoanet.com/baigiang/lamsangthongke/lstk05_kiemdinht.pdf

56. Nguyễn Văn Tuấn (2011a), "Diễn giải kết quả chẩn đoán bằng xác suất",

200

http://www.ykhoa.net/baigiang/phuongphapnghiencuu/080716_nguyenvantu

an_Dien_dich_chan_doan_bang_xac_suat.pdf

57. Nguyễn Văn Tuấn (2011b), "Ý nghĩa của odds ratio và relative risk",

http://statistics.vn/index.php?option=com_content&view=article&id=61%3

Ay-nghia-cua-odds-ratio-va-relative-risk&catid=72&showall=1

58. Nguyễn Văn Tuấn (2011c), "Ý nghĩa của trị số P",

http://statistics.vn/index.php?option=com_content&view=article&id=35:y-

nghia-cua-p-value&catid=51:test-princ-pval&Itemid=38

59. Nguyễn Văn Tuấn (2012), “Nghiên cứu y học ở Việt Nam: đặc điểm thiếu sót

và sai sót”, http://chrd.edu.vn/site/vn/?p=2702

60. Đặng Quốc Việt, Phạm Hữu Thông (2010), “Vai trò của C-reactive protein

trong chẩn đoán viêm ruột thừa cấp”, Y học Tp. Hồ Chí Minh, tập 14, số 1.

61. Vũ văn Vũ (2011), “Dấu hiệu sinh học ung thư”,

http://www.medinet.hochiminhcity.gov.vn/ttyh/bshkhkt/dau%20hieu%20sinh

%20hoc%20ung%20thu.htm

62. Trần Thị Hoàng Yến (2011), Vận dụng dạy học theo dự án trong môn xác suất

thống kê ở trường đại học (chuyên ngành kinh tế kỹ thuật), Luận án tiến sĩ,

Viện Khoa học Giáo dục Việt Nam, Hà Nội.

B. Tiếng Anh

63. Abbe C. (1871), "A Historical Note on the Method of Least Squares", Amer.

Jour. of Science, 1: 411–415, third series.

64. Adrain R. (1808), "Research concerning the probabilities of the errors which

happen in making observations, &c". The Analyst, or Mathematical

Museum. Vol. I, Article XIV, 93–109. Philadelphia: William P. Farrand and

Co.

65. Bass JW, Steele RW, Wittler RR, et al (1993), “Antimicrobial treatment of

occult bacteremia: a multicenter cooperative study”, Pediatr Infect Dis

J.;12:466-73

66. Bernshtein S.N. (1946), Probability theory, Moscow-Leningrad.

201

67. Beth Dawson, Robert G.Trapp (2004), Basic & Clinical Biostatistics,

Department Medicine at Southern Illinois University School of Medicine,

USA.

68. Betty R. Kirkwood, Jonathan A.C.Sterne (2003), Essential Medical Statistics,

2nd Edition, Blackwell Publishing.

69. Brousseau G. (1998), Theory of Didactical Situations in Mathematics, Kluwer

Academic Publishers.

70. BROUSSEAU G., BROUSSEAU N. (1987) Rationnels et décimaux dans la

scolarité obligatoire, Publication de l'I.R.E.M. de Bordeaux

71. Brousseau G., Brousseau N. & Warfield G (2002), "An experiment on the

teaching of statistics an probability", Journal of mathematical Behaviour of

chidren, Vol.20, p.363-411, Edition Elsevier Science.

72. De Moivre A. (1756), The Doctrine of Chances: or a method of calculating the

probability of events in play, London.

73. Douglas Curran-Everentt (2009), “Explorations in statistics: hypothesis tests and

P Values”, The American Physiological Socielty, 33: 81-86.

74. Dutka J. (1990), “Robert Adrain and the method of least squares”,

Archiveor History of. Exact Sciences, 41:171-184.

75. Edwards, D., Hamson, M. J. (2001), Guide to Mathematical Modelling,

Second Edition. London: Palgrave Mathematical Guides.

76. Eykhoff P. (1974), System identification: parameter and state estimation,

Wiley- Interscience, New York.

77. Fisher, R.A. (1974), Collected Papers of R.A. Fisher (1971–1974). Five

Volumes, University of Adelaide.

78. Galton F. (1888), "Corelation and their merasurements, chiefly on

anthropometric data", Proceedings of Royal Society, 45: 135-145.

79. Gauss C. F. (1857), Theoria Motus Corporum Coelestium in Sectionibus

Conicis Solem Ambientium, Translation by Charles Henry Davis, Boston.

202

80. Gigerenzer, Swijtnik, Porter, Beatty, Kruger, Daston (1989), The empire of

chance, Cambridge University Press.

81. Hayter A.J. (2007), Probability and statistics for engineering and the sciences,

third edition, Thomson, USA

82. Jay, L. Devore (2004), Probability and statistics for engineering and the

sciences, xixth edition, Thomson, USA.

83. Jesper Jerkert (2011), "The Basics of Statistical Hypothesis Testing",

http://www.jerkert.se/jesper/hypothesis_testing_article.pdf

84. Keynes J. M. (1921), A Treatise on Probability, Macmillan, London.

85. Kenneth W. Lyles, et al (2007), “Zoledronic Acid and Clinical Fractures and

Mortality after Hip Fracture”, N Engl J Med 2007; 357:1799-1809.

86. Lyapunov, A.M. (1954), "Collected works", Moscow-Leningrad, 1: 157–176.

87. Marya D Zilberberg, Alex Exuzides, James Spalding, Aimee Foreman, Alison G

Jones, Chris Colby, Andrew F Shorr (2008), “Hyponatremia and hospital

outcomes among patients with pneumonia: a retrospective cohort study”,

BMC Pulmonary medicine, 1/2008: 8-16.

88. Maxwell, J.C. (1860), “Illustrations of the Dynamical Theory of

Gases”, Philosophical Magazine, 19: 19-32.

89. Maxwell, J.C. (1860), “Illustrations of the Dynamical Theory of

Gases”, Philosophical Magazine, 20, 21-27.

90. Moore DS, McCabe GP. (2006), Producing data in Introduction to the Practice

of Statistics, 5th ed. New York, NY: W.H. Freeman and Company;191–250

91. Pauker SG, Kassirer JP (1980), “The threshold approach to clinical decision

making”, N Engl J Med; 302:1109-1117.

92. Pearson, K. (1900), "On the Criterion that a given System of Deviations from

the Probable in the Case of a Correlated System of Variables is such that it

can be reasonably supposed to have arisen from Random Sampling".

Philosophical Magazine Series 5, 50 (302): 157–175.

203

93. Sellke, T., Bayarri M.J, Berger, J.O (2001), “Calibration of p-values for testing

precise null hypothesis”, The American Statistician; 55: 62-71

94. Stigler S.M. (1977), “An attack on Gauss, Legendre”, Historia Math; 4: 31-35.

95. Stigler S.M. (1978), “Mathematical statistics in the early States”, Annals of

Statistics; 239-265.

96. Susan Miles, Gill M Price, Louise Swift, Lee Shepstone and Sam J Leinster

(2010), "Statistics teaching in medical school: Opinions of practising

doctors" School of Medicine, Health Policy and Practice, Faculty of Health,

University of East Anglia, Norwich, NR4 7TJ, UK.

97. Van Crevel H., Habbema JD, Braakman R (1986), “Decision analysis of the

management of incidental intracranial saccular aneurysms”, Neurology;

36(10):1335-1339.

98. Yule, G. U. (1900). "On the Association of Attributes in Statistics: With

Illustrations from the Material of the Childhood Society, &c", Philosophical

Transactions of the Royal Society A, Mathematical, Physical and

Engineering Sciences, 194 (252–261): 257–226.

99. Yule, G. U. (1907), "On the Theory of Correlation for any Number of Variables,

Treated by a New System of Notation", Proceedings of the Royal Society

A, Mathematical, Physical and Engineering Sciences 79 (529): 182–126.

C. Tiếng Pháp

100. Artaud M. (1993) La mathématisation en économie comme problème

didactique -Une étude exploratoire. Thèse pour l’obtention du grade de

docteur de l’Université d’Aix-Marseille II. Marseille: IREM d’Aix-

Marseille.

101. Artigue M. (1992), “Ingénierie didactique”, Recherche en didactique des

Mathématiques, La Pensée Sauvage, Grenoble.

102. Bénichou, R. Beusccart, P. Roy, C. Quantin (2009), Biostatistique.

103. Bair J., Hasbroeck G. (2002), “Sur l’enseignement de la statistique en communauté française de Belgique”, Repere-IREM No48, p.41-58.

204

104. Briand J. (2005), "Une expérience statistique et un première approche des lois

du hasard au lycée par une confrontation avec une machine simple",

Recherches en Didactique des Mathématiques, vole 25/2, Edition La

Pensée Sauvage, Grenoble.

105. Brousseau G. (1980), "Problèmes de l’enseignement des décimaux",

Recherche en Didactiques des Mathématiques, 1, 11-59.

106. Brousseau G. (1998), Théorie des situations didactiques, La pensée Sauvage,

107. CASTELAT C. (2008), "Travailler avec, travailler sur la notion de praxéologie

mathématique pour décrire

les besoins d'apprentissage

ignorés par

les

institutions d'enseignement", Recherches en Didactique des Mathématiques.

28(2), 135-182. La Pensée Sauvage, Grenoble.

108. CASTELAT C. (2012), "Des mathématiques aux scieznces physiques. Exemples

d’effets transpositif", Artes EMF 2012, Gienève.

109. Chevallard Y. (1985), La transposition didactique - du savoir savant au savoir

enseigné, éd. La Pensée Sauvage, Grenoble.

Grenoble.

110. Chevallard Y. (1991), "Concepts fondamentaux de la didactique: perspectives

apportées par une approche anthropologique", Recherches en Didactique

des Mathématiques; 12(1): 73-112., éd. La Pensée Sauvage, Grenoble.

111. Chevallard Y. & Wozniak F. (2005), Enseigner la statistique au secondaire,

entre genre prochaine et différence spécifique, in A. Mercier & C.

Margolinas, Balise ne Didactique des Mathématiques, p. 195-218, Edition

La Pensée Sauvage, Grenoble.

112. Comiti C. (2004), “L’observation des classes ordinaires: un outil pour la

recherche?” Actes du séminaire Recherche – Action, Nha Trang.

113. Coutigno C. (2001), Introduction aux situations aléatoires dès le collège: de

la modélisation à la simulation d’expérience de Bernoulli dans

205

l’environnement informatique Cabri-géomètre 2. Thèse de doctorat,

Université Joseph Fourier, Grenoble.

114. Hoai-Chau LE, Hong-Nam DAO, "Une étude sur la pratique d’enseignement

des probabilités dans la formation des medecins", Actes EMF 2012

(Espace Mathématique Francophones), Genève.

115. Henry M. (1994), L’enseignement du calcul des probabilités dans le second

dégré.Perspectives historiques, épistémologiques et didactique. Edition

IREM de Bsançon.

116. Henry M. (2004), La notion de probabilité: évolution historique et

applications contemporaines, IREM de Franche-Comté.

117. Laplace, P. S. (1774), "Mémoire sur la Probabilité des Causes par les

Événements," Savants Étranges 6: 621-656, also Oeuvres 8: 27-65, Paris.

118. Laplace, P. S. (1782), "Mémoire sur les suites", Mém. Acad. R. Sci., 10: 1-89,

Paris.

119. Laplace, P. S. (1812), "Théorie analytique des probabilités", MmeVCourcier,

Imprimeur-Libraire des Mathématiques, Quai de Augustins, 57, Paris.

120. Laplace, P. S. (1819), "Mémoire sur l'application calcul des probabilités aux

observations et spéciallement aux opérations du nivellement." Annales de

Chimie et de Physique, Paris.

121. Pichard J-F. (1997), "La théorie des probabilités au tournant du XVIIe siècle et

Frise historique sur la probabilité et la statistique", Enseigner les

probabilités au lycée, 105-130, Commission Inter-IREM STATISTIQUE

ET PROBABILITÉS.

122. Quételet A. (1835), "Sur l’hommes et le développement de ses facultés", Ou

essay de physique sociale, Vol.2, Paris.

PHỤ LỤC 1

MỘT SỐ ỨNG DỤNG CỦA XS-TK TRONG Y HỌC

1. Độ chính xác của một xét nghiệm

Để đánh giá độ chính xác của một xét nghiệm, trong y học người ta thường

dùng các thông số như độ nhạy và độ chuyên (độ đặc hiệu)

+

= ss P T

(

B+ /

)

- Độ nhạy là khả năng xét nghiệm cho kết quả dương tính đối với những người bị

bệnh B, tức là . Độ nhạy cũng còn được gọi là dương thật.

= sp P T

(

B− /

)

- Độ chuyên là khả năng xét nghiệm cho kết quả âm tính đối với những người

. Độ chuyên cũng còn được gọi là âm thật. không bị bệnh B, tức là

Để xác định hai thông số này, kết quả chẩn đoán của xét nghiệm được nghiên

cứu sẽ được so sánh với kết quả của xét nghiệm chuẩn (gold standard test) trong

một quần thể bệnh nhân. Xét nghiệm chuẩn là mốc cuối cùng để xác định bệnh và

thường mang tính xâm lấn, tốn kém về thời gian và kinh phí thực hiện. Ngược lại,

xét nghiệm được nghiên cứu là xét nghiệm thường dùng hàng ngày, ít tốn kém và

dễ thực hiện.

Bảng 1 cho biết kết quả xét nghiệm T đối với người bị bệnh ( B+ ) và không bị

bệnh ( B− ).

Bảng 1: Kết quả xét nghiệm T

B+

B−

Bệnh B Tổng cộng xét nghiệm T

T +

a b a+b

T −

c d c+d

N Tổng a+b b+d

+

+

=

= ss P T

(

/

B

)

Hai thông số này được tính theo công thức XS có điều kiện:

a + a b

=

= sp P T

(

/

B

)

Độ nhạy

d + b d

Độ chuyên

Để đánh giá về một xét nghiệm, người ta cũng sử dụng khái niệm âm giả và dương

giả. Theo đó, ta có các định nghĩa sau:

P T (

B− /

- Âm giả là khả năng xét nghiệm cho kết quả âm tính đối với người bị bệnh B và

+ )

được diễn tả theo XS có điều kiện là

P T (

B+ /

- Dương giả là khả năng xét nghiệm cho kết quả dương tính đối với người không bị

− )

bệnh B và được diễn tả theo XS có điều kiện là

+

+

+

= −

P T (

/

B

) 1

P T (

/

B

)

Dựa vào tính chất của XS, ta có:

+

= −

B

B

P T (

/

) 1

P T (

/

)

Âm giả =

Dương giả =

2. Giá trị tiên đoán

Giá trị tiên đoán cũng là các XS có điều kiện, nó phụ thuộc vào kết quả của XN T

+

+

=

PV

+ P B T

(

/

)

dương tính hay âm tính.

- Giá trị tiên đoán dương: là XS bị bệnh B nếu xét nghiệm T

=

PV

− P B T

(

/

)

dương tính.

- Giá trị tiên đoán âm: là XS không bị bệnh B nếu xét nghiệm T

âm tính.

Để xác định hai giá trị tiên đoán này, các phương pháp sau đây thường được

sử dụng: phương pháp Bayes, phương pháp cây quyết định, phương pháp tỷ cơ hội.

+

+

+

+

B

(

/

)

/

+

+

=

=

=

PV

+ P B T

(

/

)

+

B − P B P T

B

+ P B P T

+ P B P T ). ( + P T (

)

+ P B P T ). ( ( + + + B )

/

) ). (

(

/

)

). (

(

− 1

+

1

sp

+

=

+

) 1 ×

PV

1

− ( P B + P B ) (

− ss

  

  

B

(

/

)

/

=

=

=

PV

− P B T

(

/

)

− P B P T ). ( − P T (

)

− P B P T ). ( ( + − + B )

/

B − P B P T

) ). (

(

/

B

)

+ P B P T

). (

(

− 1

+

1

ss

=

+

×

1

PV

P B ( ) + − P B (

)

1

− sp

  

  

+

+

+

+

=

+

P T (

)

+ P B P T

). (

(

/

B

)

− P B P T

). (

(

/

B

)

a. Phương pháp Bayes

với

+

=

+

)

). (

(

/

)

). (

(

/

)

( P T

+ P B P T

B

− P B P T

B

+

P B (

),

P B (

− là XS tiền nghiệm. )

gọi là công thức XS toàn phần và

Một bà 27 tuổi, có thai 17 tuần, bị bệnh tiểu đường phụ thuộc Insulin đã 5 năm, đến

khám về sản khoa. Trong ba tháng đầu của thai kỳ, bà ta không kiểm soát được đường

huyết, cứ cao hơn 200 mg%. Bà nghe nói trong ba tháng đầu thai kỳ mà không kiểm

soát được đường huyết thì thai dễ bị dị tật với tỷ lệ 20 - 30%. Bà đã làm XN SAF

(Maternal, Serum Alpha Foetoprotein) thấy dương tính. XN này có độ nhạy 34% và

độ chuyên 86%

- Bà này có thai bị dị tật là bao nhiêu?

- Có nên cho làm siêu âm không? Vì siêu âm có độ nhạy 56% và độ chuyên 99,5%?

(Chu Văn thọ và tgk, 2012, tr.242-243)

Ví dụ 1. Chẩn đoán thai dị tật

1 là XN SAF và T

2 là

Trong tình huống này, có 2 XN được thực hiện, gọi T

siêu âm.

1 dương tính, ta sử dụng giá trị tiên

− 1

− 1

+

sp

1

+

=

+

) 1 ×

=

+

1 0, 2 1 0,86 ×

=

PV

1

1

0,377

Để tính khả năng thai bị dị tật khi XN T

− P B ( + P B ( )

− ss

− 0,34

− 0, 2

  

  

  

  

2 để xác

đoán dương:

1, tức là

P B+ =

) 0,337

(

định. Khi đó, XS tiền nghiệm của T Như vậy khả năng thai bị dị tật chưa cao, bác sĩ cần chỉ định thêm T 2 chính là XS hậu nghiệm của T

2 cũng dương tính thì khả năng thai bị dị tật là

− 1

− 1

+

1

sp

+

=

+

) 1 ×

=

+

1 0,377 1 0,995 ×

=

1

1

0,985

PV

. Nếu T

− ( P B + P B ) (

− ss

− 0,377

− 0,56

  

  

  

  

. Với kết quả này,

khả năng thai bị dị tật là khá cao (khoảng 99%)

PV PV+ ,

Nếu có nhiều XN để hỗ trợ chẩn đoán một bệnh thì bác sĩ phải lựa chọn XN

− ? Để

nào tối ưu nhất trong các XN đó nhằm làm tăng hai giá trị tiên đoán

)

trả lời câu hỏi này, công thức Bayes sẽ được sử dụng trong trường hợp đã biết XS

P B+ của bệnh nhân.

tiền nghiệm (

- Muốn khẳng định bệnh khi XN dương tính thì cần giá trị tiên đoán dương PV + cao

(giá trị cao nhất là 1). Do đó phải chọn XN có sp cao, tức là phải chọn XN có độ

chuyên cao.

- Muốn loại trừ bệnh khi XN âm tính thì cần giá trị tiên đoán âm PV − cao (giá trị

cao nhất là 1). Do đó phải chọn XN có ss cao, tức là phải chọn XN có độ nhạy cao.

1 và T

2 ta cần chọn XN

2 vì T T

2 có độ chuyên cao hơn T

1.

Trong ví dụ 2.1, nếu phải lựa chọn một trong 2 XN T

b. Phương pháp cây quyết định

Bài toán 1 Bệnh B có tỷ lệ lưu hành trong cộng đồng D là 20%. Để chẩn đoán bệnh

B, bác sĩ dùng xét nghiệm T có độ nhạy 90% và độ chuyên 95%.

- Ông X trong D đến khám bệnh và có kết quả xét nghiệm T dương tính. Tính xác

suất ông X bị bệnh B.

- Bà Y trong D đến khám bệnh và có kết quả T âm tính. Tính xác suất bà Y không

bị bệnh B.

Bước 1: Vẽ cây quyết định và gán giá trị xác suất trên mỗi nhánh cây và tính

xác suất đầu cành. (xem hình 1)

Hình 1. Cây quyết định về bệnh B

Bước 2: Tính xác suất

Xác suất xét nghiệm T dương tính = 0,18 + 0,04 = 0,22 (cộng ở cành T + )

Xác suất xét nghiệm T âm tính = 0,18 + 0,04 = 0,78 (cộng ở cành T − )

+

+

=

PV

+ P B T

(

/

)

- Khả năng ông X bị bệnh B khi xét nghiệm T dương tính là:

= 0,18: 0,22 = 0,818

=

PV

− P B T

(

/

)

- Khả năng bà Y không bị bệnh B khi xét nghiệm T âm tính là:

= 0,76:0,78 = 0,974

Phương pháp cây quyết định cũng còn được sử dụng trong việc tính giá trị lợi

ích của các phương án xử trí một ca bệnh, từ đó tìm ra phương án xử trí tối ưu như

trong bài toán sau đây:

Phương pháp này cũng được sử dụng cho bài toán như sau:

Bài toán 2 (Van Crevel H, 1986)

Không có sự thống nhất trong cách xử lý túi phình mạch máu não bất ngờ

(incidental intracranial saccular aneurysms). Một số quyết định phẫu thuật, số khác

thì tiên lượng tốt nên không cần phẫu thuật nhất là đối với những túi phình có

đường kính nhỏ hơn 10mm.

Sự quyết định phẫu thuật hay không là một quyết định khó khăn vì nếu phẫu

thuật sẽ gây rủi ro tức thì, nếu không phẫu thuật thì túi phình có thể vỡ bất ngờ, gây

nguy hiểm lâu dài. Một số bệnh nhân muốn tránh phẫu thuật cho dù sự tốn kém có

thể nhiều hơn sau này, một số khác thì có thể không như vậy.

Năm 1986, Crevel và đồng nghiệp xem xét vấn đề trên đối với một bệnh nhân

nữ 45 tuổi, bị đau nửa đầu (Migraine) đã 2 năm nhưng vẫn khỏe mạnh. Mặc dù đã

dùng thuốc nhưng cơn đau nửa đầu vẫn không khỏi, gia đình bệnh nhân không có

tiền căn Migraine.

Bác sĩ thần kinh nghi ngờ bệnh nhân bị dị dạng mạch máu và cho làm

Angiography, phát hiện túi phình 7 mm ở giữa bên trái động mạch não. Bác sĩ có

nên tư vấn cho bệnh nhân phẫu thuật ngăn ngừa vỡ túi phình không?

Theo nghiên cứu, XS vỡ túi phình là 29% nếu không phẫu thuật và sau khi bị

xuất huyết não thì nguy cơ tử vong là 55%, tàn phế 15%. Nếu phẫu thuật thì nguy

cơ tử vong là 2% và tàn phế là 6%

Giá trị lợi ích trên mỗi đầu cành sắp từ nhỏ đến lớn: Chết (0 điểm), khỏe hoàn toàn

(100 điểm). Theo nghiên cứu:

- Nếu phẫu thuật thì điểm tàn phế sau phẫu thuật là 75, phục hồi sau phẫu thuật là

100 điểm.

- Nếu không phẫu thuật thì điểm tàn phế trong tương lai được đánh giá tốt hơn tàn

phế sau phẫu thuật và được cho 90,1; chết sau khi vỡ túi phình trong tương lai được

coi là tốt hơn chết sau khi phẫu thuật nên cho 60,2 điểm.

- Tính giá trị lợi ích (EU) nhánh vỡ túi phình

- Giá trị lợi ích khi quyết định phẫu thuật và không phẫu thuật? Nên chọn quyết

định nào?

Hình 2. Cây quyết định xử trí bệnh đau nửa đầu

Giải

EU (vỡ) = 0,55.60,2 + 0,15.90,1 + 0,3.100 = 76,625

EU( khi không phẫu thuật) = 0,29.76,6 + 0,71.100 = 93,214

EU(khi phẫu thuật) = 0,02.0 + 0,06.75 + 0,92.100 = 96,5

Vì giá trị lợi ích khi phẫu thuật lớn hơn khi không phẫu thuật nên chọn quyết

định phẫu thuật để ngăn ngừa vỡ túi phình.

Trong cây quyết định: Điểm xuất hiện nhánh cây gọi là nút (node). Nút vuông

là nút quyết định, là điểm mà tại đó quyết định được kiểm soát bởi người ra quyết

định. Nút tròn là nút khả năng, là điểm mà tại đó các kết quả có thể xảy ra một cách

ngẫu nhiên. (Xem hình 1)

c. Phương pháp tỷ cơ hội

Tỷ cơ hội (Likelihood Ratio, ký hiệu là LR) diễn tả tỷ số về kết quả XN đối

với một cá nhân bị bệnh B và kết qủa đó đối với cá nhân không bị bệnh B.

Như vậy, LR phụ thuộc vào kết qủa XN:

E

- Nếu XN dương tính thì tỷ cơ hội dương, LR+ =E DươngA Athật DươngA Agiả

Từ đó:

+ Khi LR+ > 1 thì dương thật lớn hơn dương giả: XN có ích trong chẩn đoán

+ Khi LR+ < 1 thì dương thật nhỏ hơn dương giả: XN không có ích trong chẩn đoán

+ Khi LR+ = 1 thì dương thật bằng dương giả: XN vô dụng, không nên chỉ định XN

E

có LR+ = 1.

- Nếu XN âm tính thì tỷ cơ hội âm, LR− =E ÂmA Agiả ÂmA Athật

Từ đó:

+ Khi LR− > 1 thì âm giả lớn hơn âm thật: XN không có ích trong chẩn đoán

+ Khi LR− < 1 thì âm giả nhỏ hơn âm thật: XN có ích trong chẩn đoán

LR− = 1.

+ Khi LR− = 1 thì âm giả bằng âm thật: XN vô dụng, không nên chỉ định XN có

Các khái niệm sau đây cũng được sử dụng khi tính toán giá trị tiên đoán bằng

phương pháp tỷ cơ hội:

- Số chênh của một biến cố B, ký hiệu là odd(B), là tỷ số về khả năng xảy ra và khả

năng không xảy ra của biến cố đó. Chẳng hạn, gọi B+ là biến cố bị bệnh B của một

+

+

=

o

dd(

B

)

cá nhân trước khi cho làm XN, số chênh của biến cố bị bệnh B là

P B ( ) + − P B (

)

1

. Tỷ số này còn gọi là tỷ số tiền nghiệm.

/B T+

+ là biến cố bị bệnh B sau

/B T+

− là biến cố bị bệnh B sau khi có kết quả XN

- Tỷ số hậu nghiệm phụ thuộc vào kết quả XN, gọi

khi có kết quả XN dương tính và

+

+

+

+

+

=

=

=

o

dd(

+ B T /

)

PV

) +

) +

+

o +

PV −

/ ( + P B T

PV

+ P B T − ( /

)

1

1

dd( o dd(

+ B T / + B T /

)

1

1

)

1

=

=

=

=

o dd(

+ B T /

)

PV

) −

PV −

+

+ P B T − ( /

/ ( + P B T

)

1

− − / ( P B T − − P B T ( /

)

− PV

1 + B T / dd(

)

1

o

+

+

B T+ /

B LR ).

B T+ /

B LR ).

+ = dd( o )

+ và dd( o

− = dd( o )

âm tính. Ta có:

với dd( o

Ví dụ 2: Bệnh B có tỷ lệ lưu hành trong cộng đồng D là 20%. Để chẩn đoán bệnh

B, bác sĩ dùng xét nghiệm T có độ nhạy ss = 90% và độ chuyên sp = 95%.

- Ông X trong D đến khám bệnh và có kết quả XN T dương tính. Tính XS ông X bị

bệnh B.

- Bà Y trong D đến khám bệnh và có kết quả XN T âm tính. Tính XS bà Y không bị

bệnh B.

+

+

=

=

=

o

dd(

B

)

0, 25

P B+ =

) 0, 2

(

Ta có các thông tin sau:

)

1

0, 2 0,8

( ) P B + − ( P B

ss

1

=

=

=

+ =

=

=

LR

0,105

LR

18

XS tiền nghiệm ; tỷ số tiền nghiệm

ss −

− sp

− 1 0,9 0,95

sp

1

0,9 − 1 0,95

+

o

B T+ /

B LR ).

+ = dd( o )

+ = 0,25.18 = 4,5

;

+

o

B T+ /

B LR ).

− = dd( o )

− = 0,25.0,105 = 0,025

Tỷ số hậu nghiệm dương: dd(

+

+

=

=

=

PV

0,818

Tỷ số hậu nghiệm âm: dd(

) +

o +

dd( o dd(

+ B T / + B T /

)

1

4,5 + 1 4,5

=

=

=

PV

0,975

- XS ông X bị bệnh B là:

+

+

o

1 + B T / dd(

)

1 1 0, 025

1

T và có cùng kết quả dương tính hoặc âm

- XS bà Y không bị bệnh B là:

T T 2,

,..., n

Nếu thực hiện liên tiếp nhiều XN 1

+

o

B T+ /

o

dd(

).

.

....

+ = )

+

tính thì:

+ B LR LR 2

+ 1

LR n

+

o

B T+ /

o

dd(

...

).

Tỷ số hậu nghiệm dương: dd(

− = )

− B LR LR LR . 1 n

− 2

Tỷ số hậu nghiệm âm: dd(

P B+ =

) 0, 2

(

Chẳng hạn, trong ví dụ 1 về chẩn đoán thai dị tật, với XS tiền nghiệm

1T (có độ nhạy ss = 0,34 và độ chuyên

, nếu thực hiện liên tiếp hai XN

2T (có độ nhạy ss = 0,56 và độ chuyên sp = 0,995) đều có kết quả

sp = 0,86) và

+

+

=

=

=

=

=

o

B

dd(

)

dương tính thì khả năng thai bị dị tật là bao nhiêu?

+ = LR 1

ss −

P B ( ) + − P B (

)

1

0, 2 0,8

1 4

sp

1

0,34 − 1 0,86

17 7

+

×

=

=

o dd(

).

.

= 112 68

112

B T+ /

Ta có: ; ;

+ = )

+ 1

+ = LR 2

ss −

1 17 + = × B LR LR 2 4 7

sp

1

0,56 − 1 0,995

; dd( o

2,T T đều có kết quả dương tính là:

+

+

=

=

=

PV

0,986

) +

o +

dd( o dd(

+ / B T + B T /

)

1

68 + 1 68

Khả năng thai bị dị tật khi cả hai XN 1

Vậy nếu cả hai xét nghiệm đều dương tính thì khả năng thai bị dị tật gần như

chắc chắn (khoảng 99%), kết quả này phù hợp với phương pháp tính bằng công

thức Bayes.

LR rất có ý nghĩa trong lâm sàng vì ổn định hơn các giá trị tiên đoán và chính

xác hơn các phương pháp khác trong trường hợp kết quả xét nghiệm có giá trị liên

tục. Đối với các phương pháp khác như Bayes, cây quyết định,… nhà nghiên cứu

buộc phải chia xét nghiệm thành hai mức (dương tính và âm tính) nên phải tìm điểm

cắt và trong mỗi mức như vậy có nhiều khoảng giá trị được dồn chung lại. Phương

pháp tỷ cơ hội có thể dùng cho các xét nghiệm có nhiều mức như trong ví dụ sau:

Ví dụ 3. Một bé trai 1 tuổi bị sốt cao 39,5 độ C trong hai ngày đến khám bệnh và

không có triệu chứng khác. XS tiền nghệm bệnh nhiễm trùng máu ở trẻ từ 3 đến 36

tháng tuổi khi bị sốt trên 39,5 độ là 4%. Kết quả xét nghiệm máu của bé có chỉ số

3 A. E

bạch cầu là 36000/mmA

3 A để chia xét nghiệm này thành 2 mức và có kết E

Nếu lấy điểm cắt là 15000/mmA

quả như trong bảng 2

Bảng 2. Kết quả xét nghiệm chỉ số bạch cầu

P B+ =

) 0, 04

(

Từ đó: độ nhạy ss = 55/60 = 0,916; độ chuyên sp = 177/452 = 0,391

Gọi B+ là biến cố “nhiễm trùng máu”, ta có XS tiền nghiệm là

− 1

− 1

+

sp

1

+

=

+

) 1 ×

=

+

=

PV

1

1

0, 058

− ss

− P B ( + P B ) (

− 1 0, 04 1 0,391 × 0, 0,916

− 0, 04

  

  

  

  

Vì chỉ số bạch cầu của bé là 36000 nên khả năng bị nhiễm trùng máu là:

Vậy khả năng nhiễm trùng máu nếu có chỉ số bạch cầu là 36000 rất thấp

(khoảng 6 %) so với XS tiền nghiệm của bệnh này ( 4 %).

Nếu chia xét nghiệm này thành nhiều mức với kết quả như trong bảng 3

Nhiễm trùng máu

Chỉ số bạch cầu

LR+

(đơn vị: 1000)

Không

< 5

0

12

0

5 - 9,9

0

87

0

10 - 14,9

5

78

0,482

15 - 19,9

16

166

0,726

20 - 24,9

21

69

2,292

25 - 29,9

9

28

2,421

30 - 34,9

4

9

3,348

35 - 39,9

2

2

7,533

> 40

3

1

22,6

Tổng cộng

60

452

[Nguồn: Bass JW et al, 1993]

Bảng 3. Kết quả xét nghiệm chỉ số bạch cầu được chia thành nhiều mức

Với kết quả xét nghiệm chỉ số bạch cầu là 36000 thuộc nhóm 35000 - 39900

thì

LR+ = 7,533

+

+

=

=

=

o dd(

B

)

0, 042

P B ) ( + − P B (

)

1

0, 04 − 1 0, 04

+

+ =

=

×

o

dd(

B T+ /

B LR ).

0, 042 7,533 0,316

+ = dd( o )

+

+

=

=

=

PV

0, 24

; Ta có:

) +

o +

dd( o

dd(

+ / B T + B T /

)

1

0,316 + 1 0,316

Khả năng nhiễm trùng máu là:

Như vậy nếu chia xét nghiệm thành nhiều mức thì khả năng nhiễm trùng máu

là 24 %, tăng gấp 4 lần so với sử dụng xét nghiệm có hai mức.

3. Mô hình ngưỡng

Công việc của người thầy thuốc đòi hỏi phải đưa ra những quyết định chính

xác và hiệu quả. Để thực hiện điều này, ngoài kinh nghiệm, thì những công cụ có

thể hỗ trợ bác sĩ trong chẩn đoán và điều trị là rất quan trọng và cần thiết. xét

nghiệm là một trong những công cụ như vậy. Tuy nhiên, nếu chỉ định nhiều xét

nghiệm không cần thiết hoặc chỉ định sai xét nghiệm có thể gây tốn kém về kinh tế,

ảnh hưởng không tốt đến tình trạng sức khỏe bệnh nhân. Ngoài ra, việc chỉ định quá

nhiều xét nghiệm có thể làm cho quyết định của bác sĩ trở lên khó khăn hơn vì

những thông tin mà xét nghiệm mang lại. Do đó, việc lựa chọn và phân tích các xét

nghiệm sẽ mang lại độ chính xác và lợi ích cao nhất cho bệnh nhân, giúp bác sĩ đưa

ra các quyết định lâm sàng chính xác và hiệu quả hơn.

Trong một số trường hợp, đối với các xét nghiệm có kết quả là một trị số liên

).

tục, bác sĩ cần xác định xem với một đối tượng có kết quả xét nghiệm là x có bệnh (B+) hay không bệnh (B-

Khi đó, KĐ giả thuyết TK được sử dụng để KĐ xem đối tượng đó thuộc nhóm

nào (nhóm bệnh hay không bệnh). Nếu kết quả KĐ cho thấy đối tượng đó thuộc

nhóm bị bệnh thì với XS bệnh sau xét nghiệm có nên cho điều trị hay không. Mô

hình ngưỡng P-K sẽ giúp các bác sĩ lâm sàng giải quyết vấn đề này.

Mô hình này do Pauker và Kassier đưa ra vào năm 1980 như sau: (Pauker SG,

Kassirer JP, 1980)

Để ra quyết định cho một trường hợp lâm sàng, bác sĩ gặp phải các tình huống

sau đây:

- Để bệnh nhân theo dõi thêm mà không cần chỉ định xét nghiệm và cũng không

điều trị nếu XS bệnh của bệnh nhân quá thấp.

- Cho điều trị ngay nếu XS bệnh của bệnh nhân đủ để ra quyết định điều trị

- Cần chỉ định thêm các xét nghiệm nếu XS bệnh của bệnh nhân không đủ để ra

quyết định loại trừ và cũng không đủ để ra quyết định điều trị ngay.

γ (xem hình 3)

t và T

Mô hình ngưỡng P-K cho biết, tại một thời điểm, XS bệnh của bệnh nhân thuộc đoạn [0; 1], trong đoạn này có hai điểm đáng chú ý đó là T

Hình 3. Mô hình ngưỡng P - K

T t: là điểm mà tại đó không có sự khác biệt giữa việc để bệnh nhân theo dõi và cho

bệnh nhân làm xét nghiệm, gọi là ngưỡng xét nghiệm.

TE A: là điểm mà tại đó không có sự khác biệt giữa việc cho bệnh nhân điều trị và chỉ AγA

A E

định xét nghiệm, gọi là ngưỡng điều trị.

A thì

tE

Dựa trên mô hình này, nếu một đối tượng đến khám có XS bệnh nhỏ hơn TA

để bệnh nhân theo dõi, không chỉ định xét nghiệm, cũng không điều trị. Nếu XS

A thì cho điều trị ngay. Nếu XS bệnh thuộc đoạn (TA AγA

A) thì cần chỉ AγA

A; TE tE

A E A E bệnh lớn hơn TE

định xét nghiệm với mong muốn XS bệnh sau khi có kết quả xét nghiệm sẽ vượt ra

A và TE

A. Nếu xét nghiệm nào không làm cho XS bệnh vượt ra hai AγA

tE

A E hai ngưỡng TA

ngưỡng này thì xét nghiệm đó không có giá trị và không nên chỉ định những xét

nghiệm như vậy.

Xác định hai ngưỡng này là do nhận định của các bác sĩ lâm sàng. Đối với

bệnh mà việc thực hiện xét nghiệm đơn giản, không xâm lấn (chẳn hạn bệnh viêm

dạ dày), ít tốn kém về thời gian và kinh phí thì bác sĩ thường dễ dàng chỉ định xét

nghiệm, khi đó vùng xét nghiệm rộng ra, vùng điều trị hẹp lại. Đối với những bệnh

mà việc làm xét nghiệm mang tính xâm lấn (chẳng hạn bệnh ung thư), tốn kém về

thời gian và kinh phí thì bác sĩ ít chỉ định xét nghiệm, khi đó vùng điều trị rộng ra,

vùng xét nghiệm hẹp lại.

A và TE

A nêu trên, người ta còn sử AγA

tE

A E Ngoài phương pháp xác định hai ngưỡng TA

− 1

− 1

+

=

+

=

+

LR .

;

LR .

T γ

T t

B R

B R

 1  

  

 1  

  

dụng phương trình toán học sau đây:

Trong đó : R là tỷ lệ gây rủi ro (Risk) và B (Benefits) là tỷ lệ lợi ích của việc

điều trị.

Như vậy, việc kết hợp giữa KĐ giả thuyết TK và mô hình ngưỡng trong những

trường hợp này sẽ góp phần làm tăng tính chính xác của các chẩn đoán y học.

Ví dụ 4. Để phân biệt viêm phổi do vi trùng hay do virus, người ta đo nồng độ CRP

+ A là biến E

(C-Reactive Protein) (mg/l) trong máu và tìm điểm cắt để chẩn đoán. Gọi BA

A là biến cố viêm phổi do virus. Đo nồng độ CRP

- E

cố viêm phổi do vi trùng và BA

trong 11 người ở mỗi nhóm ta có kết quả trong bảng 4:

Bảng 4. Nồng độ CRP

B+ 3 6 11 12 13 15 17 19 10 20

B- 2 3 8 11 10 9 8 5 14 16

Nồng độ CRP của nhóm viêm phổi do vi trùng có cao hơn nồng độ CRP của

nhóm viêm phổi do virus không?

* KĐ tính chuẩn của DL:

- Vẽ biểu đồ tần số của DL ( Xem hình 4 và 5)

Hình 4. Nồng độ CRP của nhóm viêm phổi do vi trùng (VP_VT)

Hình 5. Nồng độ CRP của nhóm viêm phổi do virus (VP_VR)

- KĐ tính chuẩn của DL bằng phép kiểm Shapiro-Wilk có kết quả trong bảng

5

Bảng 5. Kết quả KĐ tính chuẩn của DL bằng phần mềm SPSS

a Sig. * .200P * .200P

Kolmogorov-SmirnovP Statistic df 10 VP_VT .116 10 VP_VR .147 Shapiro-Wilk Statistic df 10 .968 10 .969 Sig. .875 .883

Kết quả KĐ cho thấy hàm lượng CRP của nhóm viêm phổi do vi trùng và do

virus đều có PPC (p > 0,05)

A: Hai phương sai đồng nhất 0E

* KĐ tính đồng nhất của phương sai với giả thuyết HA

=

=

F

A(9; 9) = 3,178 (p = 0,285) nên hai phương sai đồng

A0,05A

29, 6 20, 044

2 s 1 2 s 2

A E = 1,476 < FE

nhất

* So sánh sự khác biệt về hàm lượng CRP trung bình giữa hai nhóm:

A ≤ µA A: µA 1E 0E

A; HA 2E

A: µA 1E

A > µA 1E

A 2E

+

(

1)

(

n 1

2 s 2

2 σ

=

Đặt giả thuyết một đuôi: HA

2 s 1 +

n 2 − 2

1) n 1

n 2

− 12, 6 8, 6

x 2

=

=

t

= 24,822

0,05(18) = 1,734 nên bác bỏ H

0 (p =

σ

+

24,822

1 1 + 10 10

  

  

x 1 1 n 1

1 n 2

= 1,795 > t

0,0447)

Kết luận: Nồng độ CRP của nhóm viêm phổi do vi trùng cao hơn nồng độ

CRP của nhóm viêm phổi do virus.

4. Ứng dụng của đường cong ROC

Trong y học, một xét nghiệm được coi là hoàn hảo nếu xét nghiệm đó phân

biệt rõ hai trạng thái có bệnh hoặc không bệnh đối với một cá nhân nhưng trong

thực tế hiếm có một xét nghiệm nào như thế. Đối với một bệnh mà có thể sử dụng

nhiều xét nghiệm để giúp chẩn đoán, việc lựa chọn xét nghiệm nào tối ưu là một

vấn đề rất quan trọng đối với bác sĩ. Để giải quyết vấn đề này, ngoài phương pháp

mô hình ngưỡng, người ta còn sử dụng đường cong ROC (Receiver Operating

Characteristic).

Theo Nguyễn Ngọc Rạng (2012), khái niệm đường cong ROC xuất phát từ lý

thuyết phát tín hiệu và đã được sử dụng trong thế chiến thế giới lần thứ hai.

Căn cứ vào DL thu thập được, máy sẽ vẽ đường cong ROC. Dựa vào đường

cong này, người quan sát xác định tín hiệu nào là thật (do máy bay bay địch tạo ra),

tín hiệu nào là giả (do nhiễu). Từ năm 1970, khái niệm đường cong ROC được sử

dụng trong y học để xác định điểm cắt của các biến định lượng nhị phân

(bệnh/không bệnh) tốt nhất, tức là xác định ngưỡng có độ nhạy và độ chuyên cao

nhất. Mỗi điểm trên đường cong ROC ứng với tọa độ Oxy, với (x ; y) = (ss ; 1-sp).

Đường cong càng lệch về phía trên bên trái của trục tọa độ thì sự phân biệt hai trạng

thái càng rõ.

Nếu sử dụng XS để chẩn đoán, trước hết ta cần tìm điểm cắt bằng chỉ số

Youden (J) và vẽ đường cong ROC để xác định nồng độ CRP nào có độ nhạy (ss)

i dương tính nếu CRP > c

i và

Đặt các xét nghiệm T và độ chuyên (sp) cao nhất, với J = max(ss + sp - 1). i để chẩn đoán như sau: T

âm tính nếu ngược lại.

Bảng 6 trình bày các mức CRP dùng để xác định điểm cắt. Dùng chỉ số

Youden (ký hiệu J) để xác định nồng độ CRP nào có độ nhạy và độ chuyên cao

nhất. Như vậy, cần chọn ss và sp sao cho J lớn nhất.

Bảng 6. Các mức CRP

CRP B- 1-sp J=ss+sp-1 B+ ss sp

10 1 1 0 1 0 0

10 2.5 1 0.1 0.9 1 0.1

9 3.5 0.9 0.2 0.8 2 0.1

9 4.5 0.9 0.4 0.6 4 0.3

9 5.5 0.9 0.6 0.4 6 0.5

8 6.5 0.8 0.6 0.4 6 0.4

8 7.5 0.8 0.7 0.3 7 0.5

8 8.5 0.8 0.8 0.2 8 0.6

8 9 0.8 0.8 0.2 8 0.6

8 9.5 0.8 0.8 0.2 8 0.6

7 10.5 0.7 0.8 0.2 8 0.5

6 11.5 0.6 0.8 0.2 8 0.4

5 12.5 0.5 0.8 0.2 8 0.3

4 13.5 0.4 0.8 0.2 8 0.2

4 14.5 0.4 0.9 0.1 9 0.3

3 15.5 0.3 0.9 0.1 9 0.2

3 16.5 0.3 0.9 0.1 9 0.2

2 17.5 0.2 0.9 0.1 9 0.1

2 18.5 0.2 1 0 10 0.2

1 19.5 0.1 1 0 10 0.1

0 20.5 0 1 0 10 0

Đường cong ROC như hình 6:

Hình 6. Đường cong ROC về xét nghiệm chỉ số CRP

Vậy chọn CRP = 9 là điểm cắt vì tại đây, chỉ số J lớn nhất tương ứng với độ

nhạy ss = 0,8 và độ chuyên sp = 0,8

(CRP > 9) (CRP < 9)

Sau khi có điểm cắt ta có DL trong bảng 7:

Tổng 10 10 20

B- 2 8 10

PV + =

Bảng 7. xét nghiệm có độ nhạy và độ chuyên cao nhất B+ 8 2 10 T+ T- Tổng

8 10

= 0,8 ⇒ Nếu một đối tượng đến từ dân số có nồng độ CRP trung bình =

14,5 (ứng với trường hợp xét nghiệm CRP dương tính) thì khả năng đối tượng đó bị

viêm phổi do vi trùng là 80 %. Bác sĩ nên điều trị theo hướng viêm phổi do vi trùng.

Để biết quyết định điều trị của bác sĩ đúng hay sai cần sử dụng mô hình ngưỡng P-

K.

AγE = 0,75.

t = 0,25 và TE

A Trong mô hình này, chọn ngưỡng xét nghiệm là T

(Xem hình 7)

Hình 7. Mô hình ngưỡng trong quyết định lâm sàng

+

+

=

=

(

/

)

PV

+ P B T

Vì đối tượng có CRP = 14,5 thuộc nhóm có kết quả xét nghiệm dương tính.

khi xét nghiệm dương tính là

8 10

Do đó, khả năng bị B+ = 0,8 >

0,75 thuộc vùng điều trị. Với kết quả này, bác sĩ cho điều trị là đúng.

5. Ba bài toán cơ bản của thống kê trong y học

Các nghiên cứu trong y học có thể có nhiều lĩnh vực khác nhau như đánh giá hiệu

quả của một loại thuốc mới hoặc một phương pháp điều trị mới, thử nghiệm

vaccine, khảo sát sự tương quan giữa một yếu tố nguy cơ và một bệnh nào đó, …

Có nhiều phương pháp nghiên cứu để đánh giá điều này như nghiên cứu lâm

sàng đối chứng ngẫu nhiên, nghiên cứu bệnh - chứng, nghiên cứu đoàn hệ, …

nhưng phương pháp chung của các nghiên cứu đều phải trải qua các bước sau đây:

- Xác định cỡ mẫu: Mỗi loại hình nghiên cứu đều có phương pháp xác định cỡ

mẫu khác nhau và công việc này phải thực hiện đầu tiên trong nghiên cứu.

- Thu thập DL trong quần thể các đối tượng nghiên cứu, phân thành hai nhóm

nếu nghiên cứu đối chứng hoặc nhiều nhóm trong các nghiên cứu khác.

- Tiến hành phân tích DL bằng các phương pháp thống kê như ước lượng

khoảng tin cậy, KĐ giả thuyết thống kê hoặc phương pháp hồi quy tương quan,…

a. Xác định cỡ mẫu

Thông thường, việc tính cỡ mẫu phải dựa vào các thông số sau đây:

- Sai lầm loại 1 (α): Phương pháp KĐ dẫn đến kết luận hai nhóm có sự khác biệt

nhưng thực sự chúng không có sự khác biệt.

- Sai lầm loại 2 (β): Phương pháp KĐ dẫn đến kết luận hai nhóm không khác biệt

nhưng thực sự chúng có sự khác biệt.

Thông thường, một nghiên cứu chấp nhận sai lầm loại 1 khoảng 1% hay 5%

và sai lầm loại 2 khoảng 0,1 đến 0,2 (Nguyễn Văn Tuấn, 2007)

- Độ khác biệt trong dân số của biến phụ thuộc. Nếu biến phụ thuộc là biến số liên

tục (huyết áp, chiều cao, cân nặng, …) thì độ khác biệt là một giá trị. Nếu biến phụ

thuộc là biến nhị phân (có 2 trạng thái) thì độ khác biệt này là tỷ lệ %.

- Các thông số khác như tỷ lệ lưu hành trong nghiên cứu cắt ngang, tỷ số OR trong

nghiên cứu bệnh - chứng, nguy cơ tương đối RR trong nghiên cứu đoàn hệ,…

Có thể tóm lược phương pháp chọn mẫu theo các bài toán TK như sau:

* Nếu nghiên cứu trên một nhóm đối tượng

- Ước tính chỉ số trung bình: Thường sử dụng đối với các biến liên tục như chiều

cao, cân nặng, huyết áp, acid uric, cholesterol, hồng cầu, bạch cầu,…

Tính cỡ mẫu để ước tính chiều cao của đàn ông Việt Nam với sai số ∆ trong vòng 1

cm. Biết rằng độ lệch chuẩn trong các nghiên cứu trước đây là 4,6; α = 5% và β =

20%

Ví dụ 5

Theo phân phối chuẩn, với α = 5% thì ZE AαA

A = 1,96 và với β = 20% thì ZE A = 1,04 AβA

Z

Z

α

2

=

βσ

Thay vào công thức tính cỡ mẫu:

= 190,44

n

+ 2

Vậy cỡ mẫu tối thiểu là n = 190. (Nguyễn Ngọc Rạng, 2012, tr.69)

A E A E

- Ước tính cỡ mẫu cho một tỷ lệ: Trong trường hợp này, phương pháp tính cỡ mẫu

tùy thuộc vào mức độ đã biết thông tin về quần thể hay chưa.

Ví dụ 6. Điều tra về tình hình nhiễm HIV ở người tiêm chích ma túy.

a. Nếu muốn sai số ước lượng không quá e = 2 % ở độ tin cậy 95% thì cỡ mẫu tối

thiểu bằng bao nhiêu?

2

2

=

n

Trường hợp này chưa có mẫu khảo sát, độ tin cậy γ = 0,95 ⇒ α = 1 - γ = 0,05

1,96 2 2

 =  ×

  

α Z  2 e 

  

= 2401 ⇒ Zα= 1,96. Áp dụng công thức tính cỡ mẫu

b. Điều tra trên 423 người tiêm chích ma túy thấy có 17 người bị nhiễm HIV. Muốn

sai số ước lượng không quá e = 2% ở độ tin cậy 95% thì cỡ mẫu tối thiểu bằng bao

nhiêu?

2

2

=

×

=

×

n

p

(1

p

)

− 0, 04(1 0, 04)

Trường hợp này đã có mẫu khảo sát, công thức tính cỡ mẫu là

1,96 2

  

  

α Z  e 

  

= 368,79

(với p = 17/423 = 0,04 là tỷ lệ nhiễm HIV trong mẫu điều tra)

Như vậy cần lấy tối thiểu 368 người.

Ví dụ 7. Đề tài “Nghiên cứu đặc điểm gây mê hồi sức trong phẫu thuật nội soi ruột

thừa có bơm thán khí vào ổ bụng” (Lê Quang Sơn, 2009)

2

=

×

n

− 0,17(1 0,17)

Theo bài báo, trong phẫu thuật nội soi, rối loạn nhịp tim gặp khoảng 17% trường

A216,82.

1,96 0, 05

  

  

hợp, với độ tin cậy 95% thì cỡ mẫu tối thiểu là: =A E

Như vậy cần tối thiểu 217 trường hợp.

* Nếu nghiên cứu trên hai nhóm đối tượng

• Cỡ mẫu trong nghiên cứu lâm sàng đối chứng ngẫu nhiên:

Nghiên cứu lâm sàng đối chứng ngẫu nhiên thường được sử dụng để đánh giá

hiệu quả của một phương pháp điều trị hoặc hiệu quả của một loại thuốc mới. Đây

là phương pháp nghiên cứu có giá trị nhất trong y học chứng cứ.

Đối với các loại biến phụ thuộc khác nhau thì phương pháp tính cỡ mẫu cũng

khác nhau:

- Nếu biến phụ thuộc là biến nhị phân (có hai trạng thái đối lập nhau: Tử

2

+

+

Z

p 2 (1

p

)

Z

(1

)

(1

)

+

α 2

p 1

p 2

p 2

p 1

p 2

vong/không tử vong, khỏi bệnh/ không khỏi bệnh,…) thì công thức tính cỡ mẫu là

=

n

p

A, ZA AαA

A được

2E

AβA 2E

2

β 2 p 1

p 1 p 2

   

 =   

A E A E A E A E với và ZA

A = 1,96 và với β = 10% thì ZA AαA

A = 1,28 AβA

2E

2E

A E A E A E A E tính theo PPC. Chẳng hạn α = 5% thì ZA

Một nghiên cứu muốn đánh giá về hiệu quả của phương pháp mới trong điều trị khối u

ác tính ở da. Với phương pháp điều trị trước đây, tỷ lệ sống sót sau 5 năm là 60%.

Người ta ta hy vọng tỷ lệ sống sót sau 5 năm khi điều trị bằng phương pháp mới tăng

thêm 20%. Cần bao nhiêu bệnh nhân trong mỗi nhóm với sai sót α = 5% và sai sót β =

10%.

+

p 1

p 2

Ví dụ 8

=

=

AβA

Với α = 5% thì ZA

A = 1,28;

=

A = 1,96 và với β = 10% thì ZA AαA 2E 2E

p

2

+ 0, 6 0,8 2

0,7

Biến phụ thuộc trong trường hợp này là biến nhị phân (sống/ chết) nên cỡ mẫu

2

×

+

+

n

A E A E A E A E

1,96 2 0, 7(1 0, 7) 1, 28 0, 6(1 0, 6) 0,8(1 0,8) − 0, 6 0,8

 =   

   

= 108

Như vậy cần chọn 108 người vào mỗi nhóm và tổng cộng là 216 người cho hai nhóm.

(J. Bénichou et al, 2009, tr.289)

2

+

Z

Z

α 2

2

=

β σ ×

n

2

- Nếu biến phụ thuộc là biến liên tục (huyết áp, cholesterol, acid uric, …) thì công

  

  

với ∆ là độ khác biệt giữa nhóm thực thức tính cỡ mẫu là

nghiệm và nhóm chứng.

So sánh hai loại thuốc điều trị tăng huyết áp, loại thuốc mới B (nhóm thực nghiệm)

làm giảm trị số huyết áp tâm thu hơn thuốc cũ A (nhóm chứng) là 10 mmHg. Các điều

tra trong dân số trước đây cho biết độ lệch chuẩn của phân phối trị số huyết áp tâm thu

là 10 mmHg. Tính cỡ mẫu cho nghiên cứu này với α = 5% và β = 10%.

2

=

×

n

2

10

Ví dụ 9

+ 1,96 1, 28 10

  

  

(Nguyễn Ngọc Rạng, 2012, tr.70)

= 20,995, tức là cần tối thiểu 21 người trong mỗi nhóm

• Cỡ mẫu trong nghiên cứu bệnh - chứng

Nghiên cứu này được dùng để xác định sự liên hệ giữa một yếu tố nhất định và

một bệnh nhất định bằng cách so sánh tỷ lệ giữa 2 nhóm: nhóm có bệnh (nhóm phơi

nhiễm yếu tố nguy cơ) và nhóm không bệnh (nhóm chứng hoặc nhóm không phơi

nhiễm yếu tố nguy cơ). Để tìm cỡ mẫu cho mỗi nhóm trong nghiên cứu này, nhà

nghiên cứu cần xác định tỷ số OR hoặc nguy cơ tương đối RR.

Ví dụ 10. Một nghiên cứu cho biết tỷ lệ hút thuốc trong dân số là 20% và nguy cơ

mắc bệnh ung thư phổi trong nhóm hút thuốc cao gấp 4 lần (OR = 4) so với nhóm

=

×

OR

không hút. Tính cỡ mẫu cho nghiên cứu này với α = 5% và β = 10%.

A và pA 1E

A = 0,2 là tỷ lệ hút thuốc trong nhóm bệnh và 2E

− −

1 1

p 1 p 2

p 2 p 1

+

p 1

p 2

=

p

Ta có = 4, gọi pA

= 0,35

A = 0,5 nên 1E

2

nhóm chứng tương ứng thì pA

A = 1,96 và với β = 10% thì ZA

A = 1,28

AαA 2E

AβA 2E

2

+

+

n

A E A E A E A E α = 5% thì ZA

1,96 2(1 0,35) 1, 28 0,5(1 0,5) 0, 2(1 0, 2) − 0,5 0, 2

 =   

   

= 51 Tính được

• Cỡ mẫu trong nghiên cứu đoàn hệ

Nghiên cứu này dùng để xác định nguyên nhân gây bệnh và được chia thành 3

loại: Hồi cứu, tương lai và kết hợp giữa hồi cứu và tương lai.

Để tính cỡ mẫu cho nghiên cứu này, nhà nghiên cứu cần phải biết nguy cơ tương

đối RR.

Ví dụ 11. Một nghiên cứu đoàn hệ tương lai để tìm nguyên nhân gây bệnh ung thư

phổi trên 2 đoàn hệ có các đặc điểm giống nhau và lành bệnh tại thời điểm nghiên

cứu. Hai đoàn hệ này chỉ khác nhau về yếu tố phơi nhiễm (hút thuốc lá và không

hút thuốc lá). Theo dõi 2 đoàn hệ này trong vòng 10 năm, các nghiên cứu trước đây

=

RR

cho biết RR = 2 và tỷ lệ hút thuốc trong dân số là 20%.

A = 0,2 là tỷ bệnh trong nhóm hút thuốc và nhóm A và pA 2E 1E

p 1 p 2

+

p 1

p 2

=

p

= 0,3

Ta có = 2 với pA

A = 0,4 nên 1E

2

không hút thuốc tương ứng thì pA

A = 1,96 và với β = 10% thì ZA

A = 1,28

AαA 2E

AβA 2E

A E A E A E A E α = 5% thì ZA

Tính được cỡ mẫu trong nghiên cứu này là n = 108

Vậy phải lấy 108 người trong mỗi nhóm.

Ví dụ 12. Một nghiên cứu đoàn hệ hồi cứu “Kết cục của bệnh nhân bị viêm phổi có

hạ natri máu: một nghiên cứu đoàn hệ hồi cứu” (Marya D Zilberberg et al., 2008)

A = 0,054 và của 1E

nhóm không hạ natri máu pA A = 0,04. Tác giả đã chứng minh được giả thuyết: “Bệnh 2E

cho biết tỷ lệ tử vong tại bệnh viện của nhóm hạ natri máu là pA

nhân viêm phổi điều trị tại bệnh viện có hạ natri máu có tỷ lệ tử vong cao hoặc nặng

2

+

+

Z

p 2 (1

p

)

Z

(1

)

(1

)

α 2

p 1

p 2

p 2

n

hơn so với bệnh nhân không hạ natri máu”. Với mức α = 5% và với β = 10%, cỡ

β 2 p 1

p 1 p 2

 =   

   

mẫu cho nghiên cứu này là = 6798

bệnh nhân. Như vậy mỗi nhóm cần 6798 bệnh nhân.

• Cỡ mẫu trong nghiên cứu tương quan.

n

= + 3

2

×

log

1 1

α β ) , + 1 − 1

R R

R 0 R 0

4 ( Z  +  − 

  

Công thức tính cỡ mẫu là

A = 0. 0E

Nếu nghiên cứu thực hiện trên một nhóm thì RA

Ví dụ 13. Một nghiên cứu tìm hiểu sự liên quan giữa hàm lượng iod trong nước

uống (µg/l) và tỷ lệ % bệnh bướu cổ. Các nghiên cứu đã thực hiện trước đây cho

biết hệ số tương quan giữa hàm lượng iod và tỷ lệ bệnh bướu cổ là R = - 0,8. Tính

= + 3

n

cỡ mẫu cho nghiên cứu này với α = 5%, β = 10% và Z(α,β) = 10,51.

2

log

× 4 10,51 − 1 0,8  + 1 0,8

  

Thay vào công thức tính cỡ mẫu thì = 49,168

Vậy cần lấy 50 người trong nghiên cứu này.

b. Ước lượng khoảng tin cậy và KĐ giả thuyết thống kê

* Ước lượng khoảng tin cậy và KĐ giả thuyết thống kê về số trung bình

• Trường hợp một mẫu: đã biết phương sai

µ

1

=

u

N

~

(0,1)

Với độ tin cậy γ, tìm hằng số C sao cho γ = P(-C ≤ u ≤ C) = 2φ(C) - 1 ⇒ φ(C)

x σ

γ+ 2

n

/

σ

C

µ= ±

x

= được tìm theo PPC, với

n

2sσ ≅ 2

⇒ khoảng tin cậy cho trung bình là :

Khi cỡ mẫu n ≥ 30 thì lấy

Trong trường hợp này để so sánh trung bình mẫu thực nghiệm x và trung bình

lý thuyết µ, các bước thực hiện là:

A: Không có sự khác biệt giữa x và µ 0E

µ

=

u

Đặt giả thuyết HA

x σ

/

n

và tìm p-value = P(|U| > u) theo PPC. Tính giá trị của

Sử dụng p_value (p giá trị) để quyết định sự khác biệt có ý nghĩa TK hay

không theo quy tắc: Nếu p < 0,05 thì sự khác biệt có ý nghĩa TK, nếu p > 0,05 thì sự

khác biệt không có ý nghĩa TK.

Có thể minh họa cách tính giá trị p thông qua một bài toán giả định sau đây:

Điều trị 20 bệnh nhân bằng hai loại thuốc A và B. Sau một thời gian theo dõi, có 15

bệnh nhân có kết quả điều trị bằng thuốc A tốt hơn so với thuốc B. Có thể kết luận

thuốc A tốt hơn thuốc B không?

HA A: Hiệu quả của thuốc A và B như nhau 0E

Để giải quyết bài toán này, giả thuyết TK là:

A: Hiệu quả của thuốc A tốt hơn so với thuốc B. AE

HA

A 0E

Gọi X là số bệnh nhân khỏi bệnh khi điều trị bằng thuốc A hoặc B. Nếu HA

x

20

x

20

=

=

×

× −

=

×

(

)

0,5

(1 0,5)

0,5

P X x

C

C

x 20

x 20

đúng, thì X có phân phối nhị thức với hàm mật độ XS là:

20

20

=

P X (

15)

0,5

XS để có tối thiểu 15 bệnh nhân có kết quả điều trị bằng thuốc A tốt hơn so

x 20

×∑ C

x

= 15

0, tức là ta có đủ bằng chứng để khẳng

với thuốc B là = 0,02 = p.

A: Hiệu quả của thuốc A tốt hơn so

Vì p < 0,05 nên đủ cơ sở để bác bỏ H định rằng kết quả KĐ phù hợp với giả thuyết H

với thuốc B.

Đối với các phép kiểm khác nhau, cách tính p cũng khác nhau. Tuy nhiên, các

2σ , cỡ mẫu n < 30

phần mềm máy tính đều có thủ tục để xác định giá trị này.

• Trường hợp một mẫu: chưa biết phương sai

Khi n < 30 sẽ có hai khía cạnh thay đổi:

- Độ lệch chuẩn của mẫu dễ bị tác động bởi các biến thiên lấy mẫu, có thể không

phải là ước lượng đáng tin cậy của s.

- Khi dân số không có PPC, trung bình mẫu có thể cũng không có PPC

Đây là kết quả của định lý giới hạn trung tâm, khi cỡ mẫu lớn thì DL sẽ có

khuynh hướng tuân theo PPC. Trong trường hợp cỡ mẫu nhỏ, DL lấy từ dân số có

PPC, người ta sẽ dùng phân phối t (student) để thay thế cho PPC.

A(n-1)

A1-γA

µ−

=

µ= ±

t

~

Student n

(

1)

x

A E Cho trước độ tin cậy γ, tìm hằng số C sao cho γ = P(-C ≤ t ≤ C) ⇒ C = tE

− ⇒ khoảng tin cậy cho trung bình là :

x s /

n

Cs n

Với

Để so sánh trung bình mẫu thực nghiệm và trung bình lý thuyết µ, đặt giả

A: Không có sự khác biệt giữa x và µ 0E

µ−

=

t

thuyết HA

x / s

n

và tìm p-value = P(|T| > t) và kết luận sự khác biệt Tính giá trị của

có ý nghĩa TK hay không.

Đo chiều cao X (cm) của 24 bé trai 2 tuổi ở Jamaica mắc bệnh hồng cầu liềm đồng

hợp tử như sau: 84.4, 89.9, 89, 87, 78.5, 84.1, 86.3, 80.6, 80, 81.3, 86.8, 83.4, 89.8,

85.4, 80.6, 85, 82.5, 80.7, 84.3, 85.4, 85, 85, 85.5, 81.9

Tính được A XE = 84,1 ; s = 3,11. Theo tiêu chuẩn về chiều cao và trọng lượng của

Anh, bé trai 2 tuổi có chiều cao là 86,5. Có thể kết luận rằng bé trai bị bệnh hồng cầu

liềm có chiều cao khác tiêu chuẩn không ? (Betty R. Kirwood, 2003)

Ví dụ 14

0 : Chiều cao trung bình của bé trai 2 tuổi mắc bệnh hồng cầu

Đặt giả thuyết H

liềm là 86,5 cm.

2σ chưa biết nên tác giả sử

µ−

=

=

t

24

Trong nghiên cứu này, n = 24 < 30 và phương sai

− 84,1 86,5 3,11

n

x s /

dụng phép kiểm t với = -3,81 với p < 0,001, dẫn đến kết

luận chiều cao trung bình của bé trai người Jamaica bị bệnh hồng cầu liềm thấp hơn

có ý nghĩa so với tiêu chuẩn của Anh.

Sau khi đưa ra kết luận này, tác giả có lưu ý « cẩn thận khi lý giải kết quả vì sự

phát triển của trẻ em bị bệnh hồng cầu liềm Jamaica được so sánh với tiêu chuẩn

của Anh chứ không phải tiêu chuẩn Jamaica với trẻ khỏe mạnh. Có thể là bệnh hồng

cầu liềm làm còi sự phát triển nhưng cần phải so sánh với trẻ Jamaica không bệnh

để khẳng định điều này »

Trong phép kiểm t ở trên, điều kiện tiên quyết là DL về chiều cao thu thập

được từ 24 trẻ em Jamaica phải có PPC nhưng trong phần KĐ của tác giả không đề

cập đến điều kiện này mà mặc định coi DL này có PPC.

2 2 ,σ σ 1 2

• Trường hợp hai mẫu : đã biết phương sai

=

2 σ σ + 2

x 1

± x C 2

µ µ− 2

1

2µ µ−

1

2 1 n 1

n 2

2

2

khoảng tin cậy cho là

1 ≥ 30 và n

2 ≥ 30 thì lấy

1sσ =

2 1

2sσ =

2 2

và . Nếu n

Ví dụ 15. Nghiên cứu sự khác biệt về nồng độ acid uric trong huyết thanh ở bệnh

nhân không có và bệnh nhân có hội chứng down. Nhóm 1 gồm 12 trẻ có hội chứng

down được chọn từ một bệnh viện điều trị trẻ chậm phát triển trí tuệ. Nhóm 2 gồm

1x = 4,5/100ml,

2x = 3,4/100ml.

15 trẻ có cùng tuổi và phái với nhóm 1. Kết quả :

1,5

Biết rằng trong hai dân số trên, nồng độ acid uric có PPC với phương sai lần lượt là 1E - µ 1 và 1,5. Tìm khoảng tin cậy 95% cho µ 2E

1σ = và

2 1

2 σ = 2

1

Đây là trường hợp phương sai đã biết : và với độ tin cậy γ

γ+ 2

= 8,9 ± 4,0085 = [4,8915 ; 12,9085]

= 0, 95 thì φ(C) = = 0,975 ⇒ C = 1,96 theo PPC.

2µ µ−

1

Từ đó, khoảng tin cậy là

1E > µ 2E

khoảng tin cậy này các biệt 0 rất lớn nên có bằng chứng để khẳng định µ

, tức là nồng độ trung bình của acid uric ở trẻ có hội chứng down lớn hơn so với

nồng độ này ở trẻ bình thường.

Phương pháp KĐ giả thuyết TK cũng được sử dụng để khẳng định DL thu

thập được có đủ bằng chứng để kết luận có sự khác biệt về nồng độ acid uric giữa

trẻ bình thường và trẻ có hội chứng down hay không, phép kiểm u sẽ được sử dụng

như sau :

0 : µ

1E = µ

2E và H

1 : µ

1E ≠ µ

2E

2

x 1

x

=

u

Đặt giả thuyết H

0 (p = 0,102)

2 2 σ σ + 1 2 n n 2 1

Tính = 2,569 ⇒ |u| > 1,96 nên bác bỏ H

Kết luận : Nồng độ acid uric trung bình của trẻ bình thường và trẻ có hội

chứng down khác nhau có ý nghĩa.

Trong một số nghiên cứu, mặc dù chưa biết phương sai hai nhóm trong dân số

nhưng do lấy mẫu có cỡ n > 30 nên có thể lấy phương sai dân số bằng phương sai

mẫu khi thực hiện phép KĐ.

Ví dụ 16. Đề tài « Nghiên cứu nồng độ Homocysteine máu, yếu tố nguy cơ mới ở

bệnh nhân nhồi máu não cấp » (Nguyễn Đức Hoàng, 2004)

Nghiên cứu này được thực hiện bằng phương pháp nghiên cứu bệnh - chứng.

Nhóm bệnh gồm 50 bệnh nhân được chẩn đoán nhồi máu não cấp đang điều trị tại

bệnh viện có nồng độ Homocysteine (Hcy) trung bình là 18,99 ± 9,2 và nhóm

chứng gồm 50 người khỏe mạnh có nồng độ Hcy trung bình là 11,86 ± 2,4. Sau khi

so sánh hai trung bình thực nghiệm trong 2 nhóm độc lập, các tác giả kết luận nồng

độ Hcy máu ở nhóm nhồi máu não cấp cao hơn hẳn nhóm chứng và sự khác biệt có

,σ σ , cỡ mẫu n

ý nghĩa TK (p < 0,001).

• Trường hợp hai mẫu: chưa biết phương sai

1 < 30 hoặc

2 1

2 2

n 2 < 30

Trong trường hợp này, DL hai mẫu thực nghiệm phải có PPC và phương sai

hai dân số đồng nhất, nếu vi phạm điều kiện này thì kết luận đưa ra có thể không

đáng tin cậy.

Ví dụ 17. Đề tài “Bước đầu khảo sát tăng đông trên bệnh nhân huyết khối tắc

mạch” (Huỳnh Thị Thanh Trang, 2008)

Trong đề tài này, tác giả so sánh Hcy trung bình giữa 2 nhóm huyết khối động

mạch và tĩnh mạch, số liệu trong bảng 8

Bảng 8. Lượng Hcy trung bình

Thực hiện phép kiểm t để so sánh hai trung bình với điều kiện DL có PPC và

x 2

=

t

phương sai đồng nhất dẫn đến kết luận Hcy trung bình nhóm huyết khối động mạch

+

σ

x 1 1 n 1

1 n 2

cao hơn nhóm huyết khối tính mạch với (p = 0,0055)

* Ước lượng khoảng tin cậy và KĐ giả thuyết thống kê về tỷ lệ

• Trường hợp một mẫu

1

=

u

Cho trước độ tin cậy γ, tìm hằng số C sao cho γ = P(-C ≤ u ≤ C) = 2φ(C) - 1 ⇒

γ+ 2

f p

)

− p − p (1 n

f

f

)

= ±

p

f C

φ(C) = được tìm theo PPC, với ~N(0;1), f là tỷ lệ thực nghiệm

− (1 n

trong mẫu n phần tử. khoảng tin cậy cho tỷ lệ là :

p−

• Trường hợp 2 mẫu

p 1

2

f

f

)

)

1

f 1

f 1

2

2

=

+

p

là: Cho trước độ tin cậy γ, khoảng tin cậy cho

p 1

2

f 1

± f C 2

γ+ 2

(1 n 1

(1 n 2

với φ(C) =

1, f

2 là tỷ lệ thực nghiệm trong mẫu 1 và mẫu 2 tương ứng.

và f

p=

p≠

phép kiểm u được dùng để KĐ sự khác biệt giữa hai tỷ lệ như sau:

0:

1:

p 1

2

p 1

2

f

f 1

2

=

u

Đặt giả thuyết H và H

0 đúng thì

+

f

(1

f

)

1 n 1

1 n 2

  

  

Nếu H ~ N(0;1)

1f ≥ 5; n

2f ≥ 5 và 0,1 < f < 0,9

Điều kiện để thực hiện phép kiểm này là n

Tính p = P(|U| > u) và kết luận sự khác biệt có ý nghĩa nếu p < 0,05.

Ví dụ 18. (Kenneth W. Lyles, et al, 2007)

Một nghiên cứu lâm sàng đối chứng ngẫu nhiên mù đôi về hiệu quả ngừa gãy

xương của thuốc Zoledzonate, các nhà nghiên cứu đã tuyển chọn 2127 bệnh nhân và

chia thành 2 nhóm. Nhóm 1 gồm 1062 bệnh nhân được điều trị bằng thuốc

Zoledzonate (liều 5mg) và nhóm 2 (nhóm chứng) gồm 1062 bệnh nhân cho uống

canxi và vitamin D. Sau 3 tháng theo dõi, kết quả như sau : Nhóm 1 có 92 bệnh

nhân và nhóm 2 có 148 bệnh nhân bị gãy xương đốt sống. Tác giả kết luận thuốc

Zoledzonate có tác dụng làm giảm tỷ lệ gãy xương đốt sống.

Để KĐ kết luận này, có thể sử dụng 2 phương pháp sau đây :

- Ước lượng khoảng tin cậy cho hiệu hai tỷ lệ

=

f

f = 1

f = 2

148 1065

+ 92 48 + 1062 1065

92 1062

p−

p−

= 0,0886; = 0,1389 ; = 0,1128

p 1

2

p 1

2

là = - 0,0503 ± 0,0268 = [-0,0771; -0,0235] khoảng tin cậy 95% cho

< 0 nên có thể kết luận thuốc Zoledzonate có tác dụng làm giảm tỷ lệ gãy xương đốt

sống.

p=

p<

Kết luận này có thể được khẳng định dựa vào phép kiểm u như sau:

0 :

1:

p 1

2

p 1

2

Đặt giả thuyết H và H

Tính được u = -3,666, p (hai đuôi) < 0,002 và p (1 đuôi) < 0,001 nên có thể kết luận

sự khác biệt có ý nghĩa TK và chứng tỏ thuốc Zoledzonate có tác dụng làm giảm tỷ

lệ gãy xương đốt sống.

* Khoảng tin cậy cho RR và OR

Đây là hai chỉ số KĐ mối liên hệ giữa một yếu tố nguy cơ và bệnh B.

Giả sử các đối tượng được chia thành 2 nhóm như bảng 9

Bảng 9. Bảng dữ liệu giả định dùng để xác định RR và OR B- b d b + d Nhóm 1 Nhóm 2 Tổng cộng B+ a c a+ c Tổng cộng a + b = n 1 c + d = n 2 1 + n n = n 2

1 đối tượng bị phơi nhiễm một yếu tố nguy cơ và sau một thời

Nhóm 1: Gồm n

1 đối tượng mắc bệnh. Khi đó tỷ lệ mắc bệnh trong nhóm này là

=

p 1

k 1 n 1

gian theo dõi có k

2 đối tượng không bị phơi nhiễm yếu tố nguy cơ và sau một

Nhóm 2: Gồm n

2 đối tượng mắc bệnh. Khi đó tỷ lệ mắc bệnh

=

thời gian theo dõi như nhóm 1 có k

p 2

k 2 n 2

trong nhóm này là

=

RR

• Nguy cơ tương đối (Relative Risk, ký hiệu là RR)

p 1 p 2

RR được định nghĩa là tỷ số giữa hai tỷ lệ trên:

Vậy:

- Nếu RR > 1: yếu tố nguy cơ làm tăng khả năng mắc bệnh

- Nếu RR < 1: yếu tố nguy cơ làm giảm khả năng mắc bệnh

- Nếu RR = 1: Không có mối liên hệ giữa yếu tố nguy cơ và bệnh

khoảng tin cậy 95 % của RR được tính như sau:

- Tính khoảng tin cậy 95 % của ln(RR) theo công thức ln(RR) ± 1,96s = [x, y];

2s

2

=

+

s

/ a c + a c

/ b d + b d

trong đó là phương sai được tính theo công thức Greenwood với

;x y e e ]

- khoảng tin cậy 95 % cho RR là [

Ví dụ 19. X quang và ung thư vú

Trong một nghiên cứu lâm sàng đối chứng ngẫu nhiên được thực hiện tại Thụy

Điển, các nhà nghiên cứu tuyển các phụ nữ trên 50 tuổi và chia thành 2 nhóm.

Nhóm 1: Gồm 66103 phụ nữ được chụp X quang (mammography) hàng năm.

Nhóm 2: Gồm 66105 phụ nữ không chụp X quang mà chỉ theo dõi bình thường

(nhóm chứng)

Sau 5 năm, nhóm 1 có 183 người chết vì ung thư vú và nhóm 2 có 177 người

chết

Bảng 10 cho biết kết quả thống kê trong nghiên cứu sự liên quan giữa chụp

XQ và ung thư vú ở phụ nữ.

Bảng 10. Dữ liệu thống kê trong nghiên cứu về bệnh ung thư vú

Nhóm 1 Nhóm 2 Tổng cộng Tử vong 183 177 360 Không tử vong 65920 65928 131848 Tổng cộng 66103 66105 132208

=

RR

[Nguồn: Nguyễn Văn Tuấn, 2011b]

p = 1

p = 2

183 66103

177 66105

p 1 p 2

, , = 1,034

Kết luận: Nhóm chụp X quang thường xuyên có nguy cơ tử vong cao hơn

nhóm chứng khoảng 3,4%.

- khoảng tin cậy 95% cho log(RR) là:

+

+

/ a c + a c

/ b d + b d

183 /177 + 183 177

65920 / 65928 + 65920 65928

ln(RR) ± 1,96 = ln(1,034) ± 1,96

0,072

0,138

e

;

e

= 0,033 ± 0,105 = [-0,072; 0,138]

] = [0,931; 1,148] - khoảng tin cậy 95 % cho RR là: [

• Tỷ số chênh (Odds Ratio, ký hiệu là OR)

Khái niệm số chênh (odd) giữa hai biến cố diễn tả tỷ số giữa khả năng xảy ra

=

=

o

o

dd

của một biến cố và khả năng không xảy ra của biến cố đó. Vậy:

dd 1

2

1

1

p 2 − p 2

p 1 − p 1

=

=

×

=

OR

RR

Số chênh của nhóm 1 là và số chênh của nhóm 2 là

− −

− −

o dd 1 o dd

1 1

1 1

2

p 1 p 2

p 2 p 1

p 2 p 1

Từ đó:

- Nếu OR =1: Sự tương quan giữa yếu tố nguy cơ và bệnh không có ý nghĩa

- Nếu OR > 1: Yếu tố tương quan với bệnh là yếu tố nguy cơ

- Nếu OR < 1: Yếu tố tương quan với bệnh là yếu tố bảo vệ (vaccine)

1 và p

2 rất nhỏ) thì OR = RR và RR thường

Chú ý rằng với những bệnh hiếm (p

được sử dụng trong nghiên cứu đoàn hệ trong khi OR thường sử dụng trong nghiên

=

=

=

o

o

OR

cứu bệnh - chứng.

1dd

2dd

a = và b

c d

o dd 1 o dd

ad bc

2

Theo bảng 9 ta thấy rằng nên

khoảng tin cậy 95 % cho OR được tính như sau:

=

+ + +

s

- Tính khoảng tin cậy 95 % cho log(OR) theo công thức:

1 a

1 b

1 c

1 d

ln(OR) ± 1,96s = [l, m]; với

;l m e e ]

- khoảng tin cậy 95% cho OR là [

Từ đó:

- Nếu khoảng tin cậy chứa 1: Sự tương quan giữa yếu tố nguy cơ và bệnh không có

ý nghĩa TK.

- Nếu khoảng tin cậy < 1: Yếu tố tương quan với bệnh là yếu tố bảo vệ

- Khoảng tin cậy > 1: Yếu tố tương quan với bệnh là yếu tố nguy cơ

Ví dụ 20. HPV (Human papilloma virus) và ung thư cổ tử cung

) đến

Một nghiên cứu bệnh - chứng thực hiện tại một bệnh viện như sau: Nhóm bệnh: 30 bệnh nhân bị ung thư cổ tử cung (K+ ) Nhóm chứng: 60 sản phụ cùng độ tuổi không bị ung thư cổ tử cung (K-

sinh tại bệnh viện

Sau 3 năm theo dõi, dùng xét nghiệm CPR tìm HPV, nhóm bệnh có 22 người

và nhóm chứng có 10 người có HPV+

. Xem bảng 11

Tổng

có HPV+

Bảng 11. DL trong nghiên cứu ung thư cổ tử cung HPV- 8 (b) 50 (d) HPV+ 22 (a) 10 (c) 30 60

2 =

2 =

1 =

1 =

=

=

=

=

RR

4, 4

OR

Ta có: p K+ K- [Nguồn: Nguyễn Ngọc Rạng, 2012] ; odd ; odd ; p 22 8 10 50 22 30

ad bc

2

; = 13,75 10 60 o dd 1 o dd

p 1 p 2 Kết luận: Khả năng bị ung thư cổ tử cung ở phụ nữ nhiễm HPV cao gấp 13,75

lần ở phụ nữ không nhiễm HPV.

Để biết OR có ý nghĩa thống kê hay không ta tính khoảng tin cậy cho OR như

+ + +

sau:

1 a

1 b

1 c

1 d

- Tìm khoảng tin cậy 95% cho ln(OR) : ln(OR) ± 1,96

= 2,621 ± 0,895 ∈ [1,565; 3,677]

A; eE

A] = [4,783; 39,52]

1,565 E

3,677 E

A A A E A A A E - Hoán chuyển để tìm khoảng tin cậy cho OR: [eE

khoảng tin cậy này vượt quá 1 chứng tỏ yếu tố yếu tố nhiễm HPV là yếu tố nguy cơ.

6. Tương quan và hồi quy

a. Tương quan giữa hai biến định tính

- Biến số định tính là một đại lượng mà ta không thể cân, đong, đo, đếm được

mà chỉ thể hiện một đặc tính nào đó của đối tượng khảo sát. Chẳng hạn, đặc tính

giới tính (nam, nữ) là biến số định tính.

- Để khảo sát sự tương quan giữa 2 biến định tính ta so sánh sự khác biệt giữa

2 hay nhiều tỷ lệ bằng phép kiểm chi bình phương, Z, hoặc phép kiểm chính xác

Fisher.

Ví dụ 21: Một điều tra được thực hiện trên 500 bệnh nhân viêm phế quản kinh niên

và nhóm chứng gồm 500 người không mắc bệnh để khảo sát mối tương quan giữa

yếu tố nguy cơ “hút thuốc” và yếu tố bệnh “viêm phế quản kinh niên” có kết trong

bảng 12.

Bảng 12. Kết quả điều tra trong nghiên cứu bệnh viêm phế quản

Bệnh Không bệnh Tổng

Hút thuốc 320 200 520

Không hút thuốc 180 300 480

Tổng 500 500 1000

[Nguồn: Lê Trường Giang, 2007]

phép kiểm chi bình phương được thực hiện để khảo sát sự tương quan giữa

yếu tố nguy cơ “hút thuốc” và yếu tố bệnh “Viêm phế quản kinh niên”

Trong trường hợp này, ta cần so sánh tỷ lệ bệnh trong nhóm hút thuốc và tỷ lệ

bệnh trong nhóm không hút thuốc.

Đặt giả thuyết KĐ Ho: Không có sự khác biệt giữa 2 tỷ lệ này

2

2 χ

=

(Hoặc đặt Ho: Không có tương quan giữa yếu tố nguy cơ và bệnh)

1000(320.300 180.200) 500.500.520.480

= 57,692

Nếu lấy mức sai lầm loại 1 là α = 0,001, độ tự do df = 1, thì giá trị ngưỡng C

2 A > C nên bác bỏ Ho. Sự tương quan giữa yếu tố nguy cơ và bệnh có E

= 10,827. Vì χA

ý nghĩa TK.

Kết luận: Hút thuốc có thể là yếu tố nguy cơ gây bệnh viêm phế quản kinh

niên.

Ta có thể dùng phép kiểm u để so sánh hai tỷ lệ như sau:

f

f 1

2

=

u

+

(1

)

f

f

1 n 1

1 n 2

  

  

~ N(0;1)

f = 1

320 520

Với = 0,615 là tỷ lệ bệnh trong nhóm hút thuốc (nhóm phơi nhiễm

f = 2

180 480

yếu tố nguy cơ) và = 0,375 là tỷ lệ bệnh trong nhóm không hút thuốc

=

f

(nhóm không phơi nhiễm)

A = 480 A = 520; nA 2E 1E

+ 320 180 + 520 480

= 0,5 là tỷ lệ bệnh chung của 2 nhóm; nA

tính được u = 7,5955. Vì |u| lớn hơn giá trị tới hạn C = 2,58 (với α = 0,01) nên bác

bỏ Ho.

phép kiểm chi bình phương hoặc phép kiểm u chỉ cho biết có tương quan giữa

yếu tố nguy cơ và bệnh hay không, không cho biết độ mạnh của sự tương quan này.

Để biết độ mạnh của sự tương quan ta cần tính tỷ số chênh OR và khoảng tin cậy

=

=

=

OR

95% cho OR.

320.300 180.200

dd o 1 dd o

ad bc

2

+

+

= 2,6666

1 320

1 1 + 200 180

1 300

khoảng tin cậy 95% cho ln(OR) là: ln(2,6666) ± 1,96

= 0,98 ± 0,255 = [0,725; 1,235]

A; eE

A] = [2,064; 3,438]

0,725 E

1,235 E

A A A E A A A E ⇒ khoảng tin cậy 95% cho OR là [eE

khoảng tin cậy cho OR > 1 nên yếu tố tương quan với bệnh (hút thuốc) là yếu

tố nguy cơ.

Khi biết giá trị của KĐ chi bình phương, khoảng tin cậy 95% cho OR cũng được

± 1

1,96 57 ,692

1,96 2 Χ =

± 1 OR

2, 6666

tính theo công thức sau: (Lê Trường Giang, 2007)

= [2,07; 3,434]

b. Tương quan giữa một biến định tính và một biến định lượng.

- Biến định lượng là đại lượng có thể đo lường được, chẳng hạn: Chiều cao,

cân nặng, huyết áp,… của một cá nhân.

- Để khảo sát sự tương quan giữa một biến định tính và một biến định lượng ta

dùng các phép kiểm như u (nếu đã biết phương sai, hoặc mẫu lớn với n ≥ 30) hoặc

dùng phép kiểm t (phương sai chưa biết, cỡ mẫu n < 30, DL có PPC)

Ví dụ 22. Đo lượng cholesterol máu (X cg/l) của một mẫu gồm 100 bệnh nhân bị

bệnh B (nhóm 1) và một mẫu 100 người bình thường (nhóm 2). Kết quả trong bảng

13

160-169 170-179 180-189 190-199 200-209 210-219 220-229 230-239

Bảng 13. Lượng cholesterol của người bình thường và người bị bệnh B

3

5

12

30

20

20

8

2

X

4

6

25

28

20

14

2

1

Nhóm 1

Nhóm 2

Khảo sát xem có sự tương quan giữa biến số định tính (bệnh, không bệnh) và

biến số định lượng (lượng cholesterol) hay không?

=

=

=

100;

200, 6;

15,102

Kết quả tính các tham số mẫu như sau:

x 1

s 1

=

=

=

100;

195, 4;

14, 005

Nhóm 1: 1 n

n 2

x 2

s 2

Nhóm 2:

0: µ

A: µ

1≠ µ

2 .

=

=

u

2,524

Đặt giả thuyết H

0, ta có

1= µ 2 và H − x x 2 1 2 2 σ σ + 2 1 n n 2 1

Theo H

Lấy α = 0,05 thì giá trị tới hạn C = 1,96 nên |u| > C, Ho bị bác bỏ

Kết luận: Có sự tương quan giữa yếu tố bệnh B và lượng cholesterol

c. Tương quan giữa 2 biến định lượng

Ví dụ 23: Ta muốn khảo sát có sự tương quan giữa thời gian leo cây và hàm lượng

thuốc được tiêm trên chuột hay không? Kết quả quan sát về thời gian leo cây y

(phút) của chuột đă được tiêm hàm lượng x (mg) thuốc tăng lực A trong bảng 14.

Bảng 14. Thời gian leo cây của chuột và hàm lượng thuốc A

x 30 18 41 38 29 39 46 41 42 24 20

y 186 183 171 177 191 177 175 176 171 196 197

Với dữ liệu này, ta tính được các tham số mẫu:

=

=

=

=

=

n

x

s

y

s

11;

33, 454;

9, 678;

181,818;

9, 463

x

y

n

(

y

)

x i

x y )( i

i

= 1

=

R

n

n

2

2

(

)

(

)

x

y

x i

y i

i

i

= 1

= 1

n

(

)

y

x i

)( x y i

= 1

i

=

Hệ số tương quan thực nghiệm

(

1)

n

s s x

y

= -0,834.

Hệ số tương quan này còn được gọi là hệ số tương quan Pearson.(Anthony

Hayter, 2007)

= 0,7 nghĩa là 70% độ phân tán của y được giải thích bởi

Hệ số xác định R2

hồi quy tuyến tính của y theo x, còn 30 % độ phân tán của y chưa giải thích được.

30 % này có thể do sai số ngẫu nhiên của thí nghiệm hoặc mức độ tương thích của

DL với mô hình hồi quy chưa cao. (Đào Hữu Hồ và tgk, 2004)

Mô hình hồi quy tuyến tính giữa x (biến độc lập) và y (biến phụ thuộc) là:

=

+ +

 y

y = ax + b

 là giá trị dự

axi

b e i

RS

y

=

= −

a

y ax

Mô hình hồi quy tuyến tính tổng quát là: trong đó y

s

x

=

y

−  là phần dư (residuals).

= - 0,816 là hệ số góc hoặc độ dốc, b = 209,107 là điểm cắt báo,

e i

y i

trên trục tung khi x = 0,

Từ đó, ta có phương trình hồi quy là y = - 0,816x + 209,107

Dùng phép kiểm t để KĐ sự tương quan giữa x và y như sau:

R

=

t

n

2

Đặt giả thuyết Ho: X và Y không tương quan

2

1

R

~ Student(n-2)

Tính được t = -4,534

A(9) = 3,249

A0,01A

A E Lấy α = 0,01 thì giá trị tới hạn C = tE

Vì |t| > C nên bác bỏ Ho.

Kết luận: x và y có tương quan và do R < 0 nên đây là sự tương quan nghịch.

Cách tính hệ số tương quan Pearson chỉ được sử dụng khi x và y tuân theo luật

PPC. Nếu x và y không tuân theo luật PPC thì phải sử dụng hệ số tương quan

Spearman hoặc Kendall (Nguyễn Văn Tuấn, 2007)

Trong mô hình phân tích hồi quy và tương quan nói trên, nhà nghiên cứu cần

tìm mô hình và mối liên hệ giữa một biến phụ thuộc liên tục và một hay nhiều biến

độc lập. Nếu biến phụ thuộc không phải là biến liên tục mà là biến nhị phân: có

bệnh/không bệnh, tử vong/ không tử vong, …thì cần phải sử dụng phương pháp

phân tích hồi quy logistic. (Jay L. Devore, 2004)

Điều kiện của phân tích tương quan định lượng là:

A là các biến cố định, không có sai sót ngẫu nhiên trong đo lường. iE

- Các giá trị xA

- Phần dư tuân theo luật PPC.

- Phần dư có trung bình bằng 0 và phương sai không đổi cho mọi đối tượng

- Không có tương quan giữa các phần dư.

Để kiểm tra các điều kiện này, ta cần phải tính các tham số liên quan đến phần dư:

* Giá trị dự báo, phần dư và độ lệch chuẩn của phần dư (xem bảng 15)

Bảng 15. Phần dư của mô hình hồi quy tuyến tính

y Observation x Predicted y Residuals Standard Residuals

30 186 18 183 41 171 38 177 29 191 39 177 46 175 41 176 42 171 24 196 20 197 1 2 3 4 5 6 7 8 9 10 11 184.636 194.424 175.663 178.110 185.452 177.295 171.585 175.663 174.848 189.530 192.793 1.364 -11.424 -4.663 -1.110 5.548 -0.295 3.415 0.337 -3.848 6.470 4.207 0.261 -2.189 -0.894 -0.213 1.063 -0.056 0.654 0.065 -0.737 1.240 0.806

* Các tham số TK khác của phần dư (xem bảng 16)

Bảng 16. Các thông số TK của phần dư

Residuals StatisticsP

a

Minimum Maximum Mean

Std. Deviation

N

Predicted Value

20.50

42.68

33.45

8.074

11

Residual

-14.446

6.729

.000

5.337

11

-1.604

1.143

.000

1.000

11

Std. Predicted Value

Std. Residual

-2.568

1.196

.000

.949

11

A là các biến cố định, không có sai sót ngẫu nhiên trong đo lường. Điều iE

* KĐ các điều kiện của mô hình hồi quy - Các giá trị xA

kiện này thông thường đã thỏa mãn nếu các phương pháp đo lường được thực hiện

đúng chuẩn.

P và

- Phần dư tuân theo luật PPC: Sử dụng phép kiểm Kolmogorov-SmirnovP

Shapiro-Wilk, kết quả cho thấy phần dư có PPC ( p > 0,05) (Xem bảng 17)

Bảng 17. Kết quả KĐ tính chuẩn của phần dư

Tests of Normality

Kolmogorov-SmirnovP Shapiro-Wilk

a Sig. *

Statistic df Statistic df Sig.

11 .507 RESIDUAL .200P 11 .939

.143 Đồ thị phần dư có hình dạng của PPC (xem hình 8)

Hình 8. Đồ thị tần số phần dư

Ngoài ra, dựa vào biểu đồ XS chuẩn Q - Q plot (xem hình 9) ta thấy các giá trị quan

sát và giá trị mong đợi tập trung gần đường thẳng chứng tỏ phần dư có PPC:

Hình 9. Đồ thị XS chuẩn của phần dư

- Phần dư có trung bình bằng 0 và phương sai không đổi cho mọi đối tượng. Điều

này có thể kiểm tra theo kết quả ở phần 2 và đồ thị phân tán sau: (xem hình 10)

Hình 10. Đồ thị phân tán của phần dư

A.

iE

Các giá trị phần dư phân tán ngẫu nhiên quanh giá trị 0 (đường nằm ngang) chứng

tỏ phương sai không đổi cho mọi đối tượng xA * KĐ tính tương thích của đường thẳng hồi quy.

A: a ≠ 0 AE

Bằng phương pháp phân tích phương sai với giả thuyết: HA A: a = 0 và HA 0E Bảng 16. Kết quả phân tích phương sai

ANOVAP

b

Model Sum of Squares df Mean Square F Sig.

a

1 Regression 651.866 1 .001P

Residual 284.861

651.866 20.595 31.651 Total 936.727 9 10

Kết quả phân tích phương sai cho thấy đường thẳng hồi quy tương thích tốt (p < 0,01) (Xem bảng 16) 7. KĐ sự phù hợp của DL với PPC

Để KĐ tính chuẩn của DL, các cách sau thường được sử dụng :

Cách 1 : Vẽ biểu đồ DL đường cong chuẩn. Nếu biểu đồ có dạng hình chuông

đối xứng với tần số cực đại nằm ở giữa, các tần số thấp hơn nằm ở hai bên, giá trị

trung bình và trung vị gần bằng nhau và độ lệch gần bằng 0.

Cách 2 : Vẽ biểu đồ XS chuẩn. Khi biểu đồ XS của DL có quan hệ tuyến tính

thì DL tuân theo PPC.

Cách 3 : Dùng KĐ Kolmogorov-Smirnov khi cỡ mẫu lớn hơn 50 hoặc KĐ

Shapiro-Wilk khi cỡ mẫu nhỏ hơn 50. DL sẽ có PPC khi p > 0,05

=

=

u

,

u

x

Trong trường hợp DL không có PPC thì dùng các phép hoán chuyển DL về chuẩn

1 x

bằng các hàm toán học như u = logx, , u = arcsinx,…

Nếu sau khi hoán chuyển, DL vẫn chưa chuẩn thì dùng các phép kiểm phi

tham số như Wilcoxon-Mann-Whitney.

97, 100, 110, 106, 103, 108, 97, 92, 113, 112, 88, 100, 95, 101, 124, 95, 111, 99, 84, 93, 82, 115,

88, 85, 79, 90, 100, 104, 109, 100, 90, 84, 102, 98, 93, 102, 102, 102, 110, 109, 90, 114, 106, 115,

103, 89, 93, 83, 100, 106, 100, 111, 101, 88, 80, 89, 103, 91, 91, 119, 97, 116, 118, 117, 95, 92,

123, 81, 102, 95, 106, 106, 94, 103, 96, 89, 94, 122, 110, 100, 80, 108, 101, 111, 98, 97, 105, 105,

98, 86, 105, 97, 87, 111, 107, 115, 96, 110, 79, 107

Ví dụ 24. Đo đường huyết x (mg%) 100 người lớn khỏe mạnh có kết quả sau:

Để biết DL này có tuân theo PPC chuẩn không, cách đơn giản nhất là vẽ biểu

đồ tần số (xem hình 11).

Hình 11. Phân phối DL đường huyết của người lớn khỏe mạnh

Nhìn trên biểu đồ tần số, DL về đường huyết của 100 người có dạng hình

chuông, tần số cao nhất tập trung ở giữa và thấp dần về hai bên. Đây là hình dạng

của PPC.

Trong trường hợp nghiên cứu trên một mẫu có kích thước lớn, để tính tham số

mẫu thuận tiện và sai số không đáng kể, có thể phân chia DL thành nhiều lớp theo

Gọi k là số lớp cần phân chia: k ≥ 1 + 3,32lgn

=

Gọi

xR là miền biến thiên của x:

R x

x i

max = n i 1,

x min i = n i 1,

Gọi khoảng rộng của mỗi lớp là

.

∆ ≤ x

xR k

=

δ

Như vậy sai số

. Với

x∆ đã biết, phân chia số liệu vào các lớp từ

∆ x 2

1iα− đến iα (Đặng Đức Hậu, 2010, tr.66)

quy tắc sau:

=

=

=

− 124 79

45

m

axx

124; m nx

i

79

Trong ví dụ 24 ta có:

xR =

i

i

nên

=

5, 625

∆ ≤ x

⇒ ∆ = 5 x

k ≥ 1 + 3,32lg100 = 7,64

45 8

Lấy k = 8,

=

=

x

99, 45;

s

10,173

Sắp xếp DL vào 8 lớp như trong bảng 17

Sau khi ghép lớp, các tham số TK tính được:

Dùng phép kiểm chi bình phương để KĐ tính chuẩn của DL:

A: x có phân phối chuẩn N(99,45; 10,173A 0E

2 A) E

99, 45

=

z

Đặt giả thuyết HA

A: 0E

− x 10,173

Theo HA ~ N(0; 1)

=

=

≤ −

P x (

85)

P z (

1, 42)

Tính các giá trị xác suất theo phân phối chuẩn tắc

− 85 99, 45 10,173

 P z  

  

=

P

(85

≤ ≤ x

90)

P

− ( 1, 42

≤ ≤ − z

0,93)

= 0,08

=

P

(90

≤ ≤ x

95)

P

− ( 0.93

≤ ≤ − z

0, 44)

= 0,1

= 0,15

=

P

(95

≤ ≤ x

100)

P

− ( 0, 44

≤ ≤ z

0, 05)

=

P

(100

≤ ≤ x

105)

P

(0, 05

≤ ≤ z

0,55)

= 0,19

=

P

(105

≤ ≤ x

110)

P

(0,55

≤ ≤ z

1, 04)

= 0,19

=

P

(110

≤ ≤ x

115)

P

(1, 04

≤ ≤ z

1,53)

= 0,14

=

P x (

115)

P z (

1,53)

= 0,09

= 0,06

= × và tính được như trong bảng 17.

' n i

n p i

(

n i

2' n ) i

2

i

2 χ

=

Với n = 100, tần số lý thuyết

0,05 (5)χ

' n i

Tính chi bình phương theo công thức = 2,376 < = 11,07 nên

A (p = 0,8) 0E

chấp nhận HA

Kết luận: x có phân phối chuẩn

Bảng 17. DL đường huyết được phân thành 8 lớp

ix ≤ 85

85 - 90 - 100 - 105 - 110 - 95 - ≥ 115

100 95 105 110 115 90

in

18 13 16 15 10 7 11 10

ip 0,08

'

0,15 0,19 0,19 0,14 0,09 0,06 0,1

in

(

n i

2' n ) i

2

i

2 χ

=

15 19 19 14 9 5 10 8

A (p = 0,8) 0E

0,05 (5)χ

' n i

- Tính được = 2,376 < = 11,07 nên chấp nhận HA

µ= ±

=

±

=

x

100, 03

± 100, 03 2, 08

- Kết luận: x có phân phối chuẩn

Cs n

1,96.10, 616 100

khoảng tin cậy 95% là:

⇒ 97,95 ≤ µ ≤ 102,11 Như vậy, nếu chọn một người có đường huyết 123 thì có thể coi đường huyết

của người này là bất thường vì nó không nằm trong khoảng tin cậy 95% này.

Trong bài toán KĐ sau, DL không có PPC vì thế không thể thực hiện phép

kiểm t. Trong trường hợp này phương pháp thường dùng là hoán chuyển DL hoặc

dùng phép kiểm phi tham số Wilcoxon.

Ví dụ 25. Men gan ALT (U/l) người bình thường (nhóm 1 gồm 16 người) và người

viêm gan B (nhóm 2 gồm 18 người)

Nhóm 1 (X1) : 36, 35, 24, 26, 23, 35, 19.5, 27, 19, 18, 42, 36.7, 40.5, 53.7, 64, 112.9

Nhóm 2: (X2) 92, 93, 23, 47, 266, 107, 82.7, 37, 157, 47, 38, 34, 19, 34, 114, 36, 57.8, 41.8

Hỏi: Hàm lượng ALT của người viêm gan B có cao hơn người bình thường

không?

Dựa vào kết quả KĐ tính chuẩn của hai nhóm bằng phép kiểm shapiro và biểu

đồ tần số (xem hình 12 và 13) cho thấy X1 và X2 không có PPC (p < 0,05):

Hình 12. Phân phối DL ALT của nhóm 1

Hình 13. Phân phối DL của ALT nhóm 2

Với kết quả KĐ trên chưa thể thực hiện phép kiểm t để so sánh hai trung bình.

Cách 1: Hoán chuyển DL bằng hàm log: Y1 = log(X1) và Y2 =log(X2)

Kết quả KĐ tính chuẩn DL sau hoán chuyển cho thấy Y1 và Y2 có PPC (p > 0,05)

So sánh hai phương sai của DL sau hoán chuyển (Y1, Y2) cho thấy hai phương sai

đồng nhất do p = 0,179 > 0,05

var.test(Y1, Y2)

F test to compare two variances

data: Y1 and Y2

F = 0.4968, num df = 15, denom df = 17, p-value = 0.1798

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval: 0.1824421 1.3973849

sample estimates:ratio of variances 0.4967957

Như vậy, hai điều kiện của phép kiểm t đã thỏa mãn là:

- DL có PPC

- Phương sai hai mẫu đồng nhất

Bây giờ có thể dùng phép kiểm t để so sánh hai trung bình.

A ≥ µA A: µA 1E 0E

A; µA 2E

A < µA 1E

2E

Đặt giả thuyết một đuôi: HA

Kết quả của phép kiểm t trong bảng 18

Bảng 18. Kết quả phép kiểm t - so sánh lượng men gan ALT

t-Test: Two-Sample Assuming Equal Variances

Y1 Y2

Mean 3.517342 4.05407

Variance 0.23903 0.48114

Observations 16 18

Pooled Variance 0.367653

df 32

t Stat -2.57627

P(T<=t) one-tail 0.007403

A. 0E

Kết quả KĐ một đuôi cho thấy p = 0,007 < 0,05 nên bác bỏ HA

Kết luận: Hàm lượng ALT của người bị viêm gan B cao hơn người bình

thường

Cách 2: Dùng phép kiểm phi tham số Wilcoxon từ DL gốc X1 và X2

wilcox.test(X1,X2)

Wilcoxon rank sum test with continuity correction

data: X1 and X2

W = 77.5, p-value = 0.02271

alternative hypothesis: true location shift is not equal to 0

A. 0E

Kết quả cho thấy p = 0,02 < 0,05 nên bác bỏ HA

Kết luận: Hàm lượng ALT của người bình thường và người bị viên gan B khác

nhau có ý nghĩa TK.

Ví dụ 26. Trong đề tài : “So sánh các thông số tầm soát trước sinh ở nhóm thai phụ

mang thai bình thường và nhóm thai phụ mang thai hội chứng Down”

Các tác giả đã so sánh hàm lượng AFP, HCG và UE3 của nhóm phụ nữ mang

thai bình thường và nhóm phụ nữ mang thai hội chứng Down

Mục tiêu: Xét tính phân phối Gaussian (PPC) của dân số tham gia sàng lọc ba

tháng giữa thai kỳ tại đơn vị sàng lọc trước sinh của bệnh viện Y. Xác định giá trị

phân biệt của các thông số TK giữa 2 nhóm thai phụ mang thai bình thường và thai

phụ mang thai hội chứng Down.

Phương pháp: Nghiên cứu hồi cứu, 01/2007 - 01/2008, dữ liệu sàng lọc trước

sinh triple test (AFP, hCG và uE3) của 6169 thai phụ có thai từ 15 đến 21 tuần tuổi và

dữ liệu của 36 thai phụ mang thai hội chứng Down được xử lý bằng phần mềm

STATA 10.0 để tìm hiểu về tính thể hiện phân phối Gaussian của các dữ liệu này và

sự khác biệt của các thông số TK giữa hai dân số thai phụ mang thai bình thường và

mang thai hội chứng Down, so sánh với một số nghiên cứu khác về sự khác biệt

này.(Đỗ Thanh Thủy và tgk, 2009)

Dữ liệu sàng lọc trước sinh của các thai phụ bị hội chứng Down:

AFP: 0.57, 0.72, 0.73, 1.01, 0.31, 0.49, 0.69, 1.23, 1.12, 0.82, 0.41, 0.94, 0.61, 1.17,

0.62, 0.48, 0.65, 0.65, 1.65, 0.82, 0.95, 0.35, 0.32, 0.48, 0.54, 0.54, 0.45, 1.29, 0.85,

0.6, 0.91, 0.6, 0.58, 0.95, 0.69, 1.25

hCG: 2.3, 3.2, 1.3, 2.8, 1.9, 2.0, 3.3, 2.3, 2.9, 3.8, 2.1, 3.0, 1.9, 4.0, 1.7, 1.5, 2.2, 0.8,

3.9, 1.7, 2.2, 2.2, 1.4, 2.1, 2.1, 3.0, 1.3, 3.2, 3.3, 2.1, 1.1, 0.9, 0.8, 6.8, 2.5, 2.8

uE3: 0.66, 0.59, 0.74, 0.52, 0.21, 0.86, 0.6, 0.44, 0.67, 0.9, 0.41, 1.08, 0.12, 0.83,

0.73, 0.94, 0.27, 0.48, 1.25, 1.11, 0.81, 0.25, 0.13, 0.48, 0.5, 0.58, 0.53, 0.95, 0.97,

0.34, 1.06, 0.29, 0.35, 0.49, 0.24, 0.62

Kết quả KĐ tính chuẩn DL

shapiro.test(AFP)

Shapiro-Wilk normality test

data: AFP

W = 0.9372, p-value = 0.04162

shapiro.test(HCG)

Shapiro-Wilk normality test

data: HCG

W = 0.8844, p-value = 0.001311

shapiro.test(UE3)

Shapiro-Wilk normality test

data: UE3

W = 0.9725, p-value = 0.499

Trong ba dãy DL này, AFP và HCG không có PPC. Các nhà nghiên cứu đã

hoán chuyển DL bằng hàm log để DL có PPC (Xem hình 13)

Hình 14. Phân phối Gaussian của log(uE3MoM) giữa nhóm thai phụ mang thai

bình thường và nhóm mang thai hội chứng Down

Theo tác giả, việc hoán chuyển DL bằng hàm log10(MOM) của các thông số

sàng lọc AFP, hCG và uE3 sang phân phối Gaussian (PPC) giúp cho việc sàng lọc

chính xác, ít bị ảnh hưởng của các giá trị ngưỡng trên, ngưỡng dưới và cỡ mẫu,

đồng thời cho phép dễ dàng so sánh giữa các nghiên cứu với nhau. Các thông số TK

giữa hai dân số thai phụ mang thai bình thường và mang thai hội chứng Down của

AFP, hCG và uE3 là khác biệt có ý nghĩa TK với p < 0,05.

Từ kết quả này, các tác giả đưa ra kết luận: Với sự khác biệt có ý nghĩa giữa

các thông số TK của hai dân số mang thai bình thường và dân số mang thai hội

chứng Down, bộ ba xét nghiệm sàng lọc ba tháng giữa thai kỳ có ý nghĩa trong việc

phát hiện các thai phụ có nguy cơ cao mang thai hội chứng Down, đặc biệt đối với

các tỉnh thành xa trung tâm ở Việt Nam.

PHỤ LỤC 2

BIÊN BẢN GIỜ HỌC "MÔ HÌNH NGƯỠNG"

Trong bản này, chữ in nghiêng là ghi chú của người quan sát, chữ được gạch

dưới là chỗ GV viết lên bảng.

1. GV : Như chúng ta đã biết trong bài học trước về việc chỉ định xét nghiệm như

thế nào để tránh gây lãng phí và tiết kiệm thời gian cho bệnh nhân nhưng vẫn đảm

bảo chẩn đoán chính xác.

2. GV hỏi : Để chẩn đoán được chính xác, các anh chị hãy cho biết quy trình của

một chẩn đoán là gì? Sau 3 phút

3. SV: Thưa thầy, khi một người đến khám bệnh thì có thể người đó bị bệnh hoặc

người đó không bị bệnh. Trường hợp không bị bệnh do khám lâm sàng thấy những

biểu hiện của bệnh hầu như không có hoặc tần suất bệnh quá thấp thì sẽ cho bệnh

nhân về nhà tự theo dõi. Trường hợp có khả năng bị bệnh căn cứ vào những triệu

chứng mà người bệnh kể hoặc tần suất bệnh cao, để giúp chẩn đoán chắc chắn hơn

ta sẽ chỉ định những xét nghiệm xem kết quả xét nghiệm dương tính hay âm tính để

ra quyết định.

4. GV : Như vậy, khi nghi ngờ một người bị bệnh, em đều cho làm xét nghiệm à?

5. SV : Dạ, vâng!

6. GV: Cả lớp có bổ sung gì về câu trả lời của bạn không? Lớp im lặng không có

câu trả lời

7. GV : Câu trả lời của bạn SV này đúng nhưng chưa đủ, để hiểu rõ hơn quy trình ra

quyết định cho một trường hợp lâm sàng, hôm nay, chúng ta học một phương pháp

khác có thể giúp ích cho chẩn đoán bệnh dựa vào tần suất bệnh và kết quả của các

UMÔ HÌNH NGƯỠNG

xét nghiệm. Đó là phương pháp mô hình ngưỡng. GV viết lên bảng

Mô hình này do hai nhà khoa học UPauker và Kassier (1980)U đưa ra, viết tắt là Umô

hình ngưỡng P – K

Vấn đề đặt ra là, khi khám lâm sàng cho một người nghi ngờ bị bệnh B, làm thế nào

để đưa ra quyết định đúng.

UĐể bệnh nhân theo dõi mà không điều trịU, cũng không cần chỉ định xét

8. GV : Trong trường hợp này, chúng ta thường gặp ba tình huống sau :

-

UCho điều trị ngay Unếu xác suất bệnh của bệnh nhân đủ để ra quyết định điều

nghiệm nào nếu xác suất bệnh của bệnh nhân quá thấp.

-

UCần chỉ định xét nghiệmU vì xác suất bệnh của bệnh nhân không đủ để ra

trị.

-

P B+ (

quyết định loại trừ và cũng không đủ để ra quyết định điều trị ngay.

≤ ) 1

Theo P-K, tại một thời điểm nhất định, Uxác suất bệnh của bệnh nhân 0

(GV vẽ mô hình trên bảng)

Vùng theo dõi Vùng xét nghiệm Vùng điều trị

tT

0

tT và Tγ chia đoạn [0;1] thành 3 vùng :

1 Trong đoạn này, có hai mốc đáng chú ý là U

tT là điểm mà tại đó không có sự khác biệt giữa việc để bệnh nhân theo dõi và việc

vùng theo dõi, vùng xét nghiệm và vùng điều trị.

chỉ định xét nghiệm, Tγ là điểm mà tại đó không có sự khác biệt giữa việc chỉ định

xét nghiệm và việc điều trị.

(

)

GV (viết trên bảng) : U1. Các xác định xác suất tiền nghiệm

P B+ của bệnh nhân trước xét nghiệm

9. GV : Vấn đề đặt ra là xác suất bệnh

(XSTN) được xác định như thế nào?

10. SV : Dựa vào tần suất bệnh và triệu chứng lâm sàng.

11. GV : Đúng rồi, bác sĩ cần dựa vào tần suất bệnh trong cộng đồng và điều chỉnh

thêm dựa vào bệnh sử và khám lâm sàng của bệnh nhân. Trước khi chỉ định một xét

nghiệm, người thầy thuốc nên nhớ một nguyên lý cơ bản của Sackett rằng các dữ

liệu thu thập được qua thăm khám lâm sàng và hỏi bệnh sử thì quan trọng hơn rất

nhiều các thông tin mà các xét nghiệm mang lại.

12. GV : (đọc và ghi trên bảng) VD: Một bệnh nhân bị Urun tayU và có Unhịp tim nhanh U

thì có nguy cơ Ucường giáp (80%)U cao hơn Unguy cơ bị Wilson (1%)U rất nhiều. Tuy

nhiên qua hỏi bệnh sử thì bệnh nhân cho biết bệnh nhân Ucó em trai đã được chẩn

đoán bị bệnh WilsonU, Ukhi đó khả năng bị bệnh Wilson của bệnh nhân tăng lên 95%.

13. SV : Thưa thầy, các con số này chỉ mang tính định tính?

14. GV : Đúng như vậy, vì xác suất này chỉ dựa trên tần suất bệnh. Để mang tính

định lượng, người thầy thuốc nên cho XSTN của bệnh nhân dưới dạng % thay vì

dùng các từ “nghi ngờ”, “có thể” hay “nhiều khả năng”.

15. GV tiếp tục với câu hỏi: Khi có XSTN rồi, chúng ta sử dụng mô hình ngưỡng

như thế nào?

16. SV : Chúng ta xem xác suất đó nằm trong vùng nào của mô hình ngưỡng để ra

quyết định.

)

(

GV (viết trên bảng):U2. Quyết định lâm sàng

P B+ , hoặc xác suất hậu nghiệm

+

+ P B T

(

/

),

+ P B T

(

/

)

U, gọi chung là p) rồi, chúng ta sử dụng mô hình ngưỡng để đưa

17. Khi có xác suất bệnh (UXác suất tiền nghiệm

Uxác định xem p nằm ở vùng nào trong 3 vùng của mô hình ngưỡng

ra quyết định. Cụ thể như sau:

UNếu

p T< thì quyết định không cho điều trị

-

t

-

UNếu p Tγ>

< <

UNếu

thì ra quyết định điều trị ngay -

p Tγ

tT

thì chỉ định một xét nghiệm -

18. GV : VD. Trong Ubệnh suyễnU, ta chọn Ungưỡng xét nghiệm là 10%U, Ungưỡng điều

trị là 80%U theo mô hình ngưỡng như sau:

Vùng theo dõi Vùng xét nghiệm Vùng điều trị

0 0,1 0,8 1

P B+ <

) 10%

(

19. GV : Nếu một bệnh nhân có khả năng bị bệnh suyễn qua hỏi bệnh sử và khám

P B+ >

) 80%

(

lâm sàng nếu thì chúng ta quyết định chỉ để theo dõi thêm và không

thì chúng ta quyết định điều trị cho bệnh nhân làm hô hấp ký. Nếu

<

<

10%

P B+ (

) 80%

ngay cho bệnh nhân mà không cần làm hô hấp ký để chẩn đoán. Nếu

, chúng ta hy vọng kết quả hô hấp ký sẽ giúp chẩn đoán hay loại

0,1

Tγ =

0,8

trừ được bệnh suyễn và cho bệnh nhân làm xét nghiệm đó.

tT =

19. SV : Tại sao có hai ngưỡng và ? Làm thế nào để xác định 2

ngưỡng này?

20. GV : Đó là vấn đề chúng ta cần nghiên cứu trong phần tiếp theo.

GV (ghi trên bảng) 3. UCách xác định ngưỡng

UCách 1

21. Chúng ta có hai cách để xác định các ngưỡng này như sau:

22. GV. Hai ngưỡng này được xác định tùy theo nhận định của các bác sĩ lâm sàng.

- Đối với những xét nghiệm đơn giản, ít tốn kém, không xâm lấn thì bác sĩ

thường chỉ định xét nghiệm đó cho dù xác suất bệnh thấp, khi đó vùng xét

nghiệm rộng ra.

- Trái lại, bác sĩ ít muốn chỉ định xét nghiệm nếu xét nghiệm tốn kém, xâm

lấn, ít chính xác. Khi đó, vùng xét nghiệm hẹp lại.

23. SV : Nhưng nếu chỉ dựa vào những nhận định như vậy, em nghĩ sẽ kém chính

tT và Tγ khi đó chỉ mang tính định tính.

xác vì các ngưỡng

24. GV : Đúng vậy, hai ngưỡng này được xác định dựa vào tính chất của bệnh và

UCách 2

bản chất của xét nghiệm.

tT và Tγ như

25. GV: Để khắc phục nhược điểm trong việc nhận định 2 ngưỡng

tT và Tγ dựa vào phương

các em có ý kiến ở trên, có tác giả đề nghị cách xác định

− 1

− 1

+

=

+

=

+

LR

LR

.

1

;

.

1

T t

T t

B R

B R

  

  

  

  

trình sau:

Trong đó, UR là tỷ lệ gây rủi ro (Risk), B là tỷ lệ lợi ích (Benefits)U.

26. GV : Sau đây chúng ta sẽ xét một ví dụ minh họa. GV viết trên bảng

UDùng xét nghiệm siêu âm có ss = 0,6 và sp = 0,7 trên một người bị MI thì có tỷ số

3

= U. UTính

tT và Tγ của xét nghiệm trên loại bệnh này.

B R

tT và Tγ

Bây giờ dùng công thức trên, các em tính 2 ngưỡng

GV để SV làm trong 5 phút, sau đó gọi một SV lên bảng tính

− 1

− 1

− 1

+

=

+

=

+

=

=

.

1

1

+ .3 1

0,142

LR

T t

ss −

B R

1

B . sp R

0, 6 − 1 0, 7

  

  

  

  

   − 1

   − 1

− 1

1

=

+

=

+

=

=

.

1

1

+ .3 1

0, 28

LR

T t

B R

− ss B . sp R

  

  

− 1 0, 4  0, 7 

  

  

  

27. SV viết trên bảng:

Sau khi tính xong, SV về chỗ ngồi. GV quan sát trên bảng và nhận xét.

28. GV : Kết quả tính toán trên là hoàn toàn chính xác.

29. GV : Bây giờ chúng ta sẽ xem xét quy trình dùng mô hình ngưỡng cho một

P B+ (

)

UXác định xác suất tiền nghiệm

U của bệnh nhân.

trường hợp lâm sàng. Chúng ta thực hiện theo trình tự sau: (GV viết trên bảng)

( P B

UNếu xác suất

+ ≤ U U thì không điều trị )

Sau đó, xem xác suất này nằm ở vùng nào trong ba vùng của mô hình ngưỡng.

T t

P B (

+ ≥ )

UNếu

U Uthì cho điều trị

+

P B (

)

UNếu

U Uthì chỉ định xét nghiệmU với hy vọng xác suất hậu

tT

tT và Tγ . Nếu xét nghiệm nào không

nghiệm sẽ vuợt ra khỏi hai ngưỡng

đưa xác suất hậu nghiệm ra khỏi hai ngưỡng này thì xét nghiệm đó không

có giá trị và chúng ta không nên chỉ định những xét nghiệm như vậy.

GV ngừng lại một lúc khoảng 1 phút

30. GV : Làm thế nào để xác định xác suất hậu nghiệm sau khi có kết quả xét

nghiệm?

31. SV: Dùng công thức Bayes.

32. GV : Đúng rồi, ta có thể dùng công thức Bayes hoặc các phương pháp mà các

em đã được học như : phương pháp tỷ cơ hội, phương pháp bảng 2 x 2…

GV(viết trên bảng) 4. UCách tính xác suất hậu nghiệm

33. GV : Như vậy trong trường hợp phải chỉ định một xét nghiệm, sau khi có kết

quả xét nghiệm, xác suất bệnh của bệnh nhân sẽ thay đổi. Xác suất này ta gọi là xác

suất hậu nghiệm (XSHN).

34. GV : Chúng ta chú ý, đây là những xác suất có điều kiện, và như vậy ta có thể

sử dụng các công thức tính xác suất có điều kiện trong phần trước để tính xác suất

+

+

+

+

(

/

B

)

(

/

B

)

=

=

+ P B T

(

/

)

+ P B T

(

/

)

này. Một trong những công thức đó là công thức Bayes.

+ P B P T ). ( + P T (

)

+ P B P T ). ( − P T (

)

;

35. GV. Chúng ta sẽ làm một phép kiểm minh họa cho mô hình này.

GV đọc và chép phép kiểm trên bảng:

Một mẫu gồm U35 ngườiU lấy ngẫu nhiên từ dân số D để khảo sát tình hình bệnh B,

- + U) và 15 người không bị bệnh B (BU bác sĩ thấy Ucó 20 người bị bệnh B (BU

P). UĐo lượng

P P P

X (mg/l) Utrong mẫu trên ta có kết quả sau:

+ U : 9 10 10 12 13 13 13 14 14 14 15 15 16 16 17 17 17 17 18 19 BP

P

- BP

U : 16 16 17 17 18 18 18 18 18 18 19 19 19 19 19

P

1T để chẩn đoán bệnh B. Lấy

X Cf≤ 1

X Cf> 1

Ta muốn dùng số đo lượng X như là một xét nghiệm

U; U 1T − khi

0, 25

điểm cắt UCf UR1RU = 17U với quy định U 1T + khi

tT =

0, 7

Trong mô hình ngưỡng P – K, chọn ngưỡng xét nghiệm là và ngưỡng điều

Tγ =

trị là . Bác sĩ chẩn đoán anh M trong D có bệnh B, cho M làm xét nghiệm

1T − thì không điều trị, nếu là

1T + thì điều trị. Bác sĩ

TR1 , Rkết quả xét nghiệm nếu là

quyết định như vậy đúng không? Tại sao?

36. GV : Chúng ta thực hiện theo các bước của mô hình ngưỡng. Nào, trước hết các

em hãy suy nghĩ và tính độ nhạy và độ chuyên của xét nghiệm. Sau 2 phút, GV gọi

một SV lên bảng.

- + BP

37. SV viết trên bảng

BP Tổng

1T +

18 4 22

1T −

2 11 13

+

)

)

=

=

=

=

=

=

ss

sp

0,9;

0, 73

+ P T B ( 1 + P B ( )

18 20

− P T B ( 1 − P B ( )

11 15

Tổng 20 15 35

Sau 5 phút, SV làm xong về chỗ ngồi.

38. GV. Chúng ta xem bạn tính đúng chưa? GV quan sát trên bảng một lúc.

39. GV. Hoàn toàn chính xác.

40.GV: Bước tiếp theo chúng ta tính xác suất tiền nghiệm để xem xác suất này nằm

trong vùng nào của mô hình ngưỡng. Xác suất tiền nghiệm trong trường hợp này

được xác định như thế nào?

Cả lớp im lặng một lúc rồi một SV trả lời :

41. SV : Dựa vào số liệu khảo sát.

GV yêu cầu sinh viên này tính xác suất tiền nghiệm trong vở ghi của mình và đứng

=

P B+ =

(

)

0,57

20 35

cạnh quan sát sau đó đi về bảng và viết:

42. GV : Các em có nhận xét gì về xác suất này? Trong trường hợp này bác sĩ cho

làm xét nghiệm có đúng không?

UMô hình ngưỡng P – K

Các em thử vẽ mô hình ngưỡng ra xem nào. GV vẽ trên bảng

0, 7

0, 25

Không điều trị Cho làm xét nghiệm Điều trị

Tγ =

tT =

0

P B+ =

) 0,57

(

GV để một lúc khoảng 3 phút để sinh viên suy nghĩ tìm câu trả lời.

43. Một SV : Do nằm trong vùng xét nghiệm nên bác sĩ cho M làm xét

nghiệm là đúng.

44. GV : Bây giờ bác sĩ đã chỉ định xét nghiệm, công việc tiếp theo của chúng ta là

tính xác suất hậu nghiệm để xem xác suất này nằm ở vùng nào trong mô hình

1T + và

1T − . Các em suy nghĩ và tính toán, sau

ngưỡng với hai khả năng xét nghiệm

đó tôi sẽ gọi một bạn lên bảng tính các xác suất này. GV để SV tính trong thời gian

5 phút sau đó gọi một SV lên bảng.

45. SV viết trên bảng:

+

=

+

=

+ −

=

)

). (

(

/

B

)

). (

(

/

B

) 0,57.(1 0,9)

(1 0,57).0, 73 0,371

− P T ( 1

− + P B P T 1

− − P B P T 1

+

B

(

/

)

=

<

=

=

=

0,154

0, 25

(

/

)

Nếu 1T − , ta có:

T t

− + P B T 1

0,57.0,1 0,371

− + P B P T ). ( 1 − P T ( ) 1

nên bác sĩ không điều trị

+

(

/

B

)

+

=

=

=

>

=

/

,

)

0,816

0, 7

cho M là đúng.

T γ

+ + T P B T ( 1 1

0,57.0,9 − 1 0,371

+ + ). ( P B P T 1 + P T ( ) 1

Nếu nên bác sĩ điều trị

cho M là đúng. SV làm xong về chỗ ngồi

46. GV : Các em có nhận xét gì về bài làm trên bảng? (GV quan sát bảng). Như vậy

các quyết định của bác sĩ trong trường hợp này là đúng vì kết quả đó phù hợp với

mô hình ngưỡng P – K. Các em đã hiểu rõ về mô hình ngưỡng và ứng dụng mô hình

này vào chẩn đoán chưa?

47. GV : Trong chăm sóc và điều trị bệnh, người thầy thuốc luôn phải đối mặt với

hai vấn đề quan trọng : Chẩn đoán đúng và lựa chọn điều trị sao cho có lợi nhất cho

bệnh nhân. Giải quyết hai vấn đề này không dễ dàng, nhất là trong những tình

huống lâm sàng phức tạp.Có nhiều trường hợp phải sau một thời gian điều trị, bác sĩ

mới có được chẩn đoán bệnh. Khi có chẩn đoán bệnh rồi thì việc lựa chọn phương

án điều trị nào trong nhiều phương án cũng gặp nhiều khó khăn, đôi khi chỉ dựa vào

kinh nghiệm nên thiếu cơ sở khoa học. Để giải quyết những tình huống lâm sàng

phức tạp thì việc sử dụng mô hình ngưỡng để phân tích các quyết định lâm sàng là

một công cụ khoa học quan trọng, giúp người thầy thuốc đưa ra các quyết định đúng

đắn.

48. GV : Các em về nhà đọc kỹ lý thuyết và làm các phép kiểm ở nhà, phần phép

kiểm phần này tương đối đơn giản nhưng không được in trong giáo trình nên tôi đã

chuyển phép kiểm làm thêm cho lớp trưởng để photo cho cả lớp. Buổi học hôm nay

kết thúc ở đây.

GV cho phép kiểm làm ở nhà:

Cho biết :

Tpulmonary embolism) 2

Ttrong dân số D là

- Tỷ lệ tử vong của bệnh nghẽn mạch phổi (2

20%.

Tventilation/perfusion scan -

- Tỷ cơ hội dương và âm của xạ đồ thông khí/máu (2

TV/Q) tương ứng là 16,8 và 0,17.

0,95%

2

tT =

49%

- Trong mô hình ngưỡng P – K, chọn ngưỡng xét nghiệm và ngưỡng

Tγ =

điều trị là .

1. Bác sĩ chẩn đoán anh M trong D có bệnh nghẽn mạch phổi (gọi tắt là bệnh B),

+ P thì

cho M làm xạ đồ V/Q (gọi là tắt là xét nghiệm T). Kết quả xét nghiệm nếu TP

cho điều trị ngay. Bác sĩ quyết định như vậy có đúng không? Tại sao?

2. Tìm độ nhạy (ss), độ chuyên (sp), dương giả (Fp) và âm giả (Fn) của xét nghiệm

T.

Tγ =

0,85

3. Trong mô hình ngưỡng P – K, chọn ngưỡng xét nghiệm là TRtR = 0,15 và ngưỡng

điều trị là . Bác sĩ chẩn đoán anh M trong D có bệnh B, cho M làm xét

nghiệm nước tiểu (T). Nếu T dương tính thì cho điều trị, nếu T âm tính thì không

điều trị. Bác sĩ quyết định như vậy đúng không? Trong trường hợp này, xét nghiệm

T có giá trị trong chẩn đoán không?

PHỤ LỤC 3

BIÊN BẢN GIỜ HỌC KĐ GIẢ THUYẾT TK

Thời gian: từ 7g30 đến 9g00 ngày 10/11/2012

Giảng viên: T.Đ.T

Trong biên bản này: Chữ in nghiêng là ghi chú của người quan sát, bài giảng

được chiếu slide, chỗ nào cần nhấn mạnh thì GV ghi lên bảng.

GV mở đầu bằng việc ôn lại mục đích, ý nghĩa của KĐ giả thuyết TK, cách đặt giả

thuyết TK, các loại sai lầm trong KĐ giả thuyết TK.

1. GV: KĐ giả thuyết TK có hai bài toán cơ bản là so sánh các giá trị trung bình và

so sánh các tỷ lệ. Chúng ta đã học so sánh các tỷ lệ bằng phép kiểm phép kiểm u và

phép kiểm chi bình phương. Mỗi phép kiểm đều có điều kiện áp dụng nghiêm ngặt,

nếu không kiểm tra những điều kiện này thì kết luận rút ra từ các phép kiểm có thể

không đáng tin cậy, thậm chí sai lầm. Chẳng hạn trong phép kiểm u để so sánh hai

tỷ lệ thì điều kiện cần kiểm tra là: np ≥ 5; n(1-p) ≥ 5; 0,1< p < 0,9. Còn trong phép

kiểm chi bình phương thì điều kiện đó là tần số lý thuyết không nhỏ hơn 5.

Hôm nay chúng ta học tiếp bài toán so sánh hai trung bình bằng phép kiểm u và t.

So sánh hai trung bình là bài toán tương đối phổ biến trong TK y học, nó dùng để so

sánh các giá trị trung bình của các biến định lượng.

GV ôn lại các bước trong bài toán KĐ giả thuyết TK bằng cách đặt câu hỏi

2. GV: Chúng ta đã biết quy trình thực hiện một bài toán KĐ giả thuyết TK sau khi

đã thu thập được DL từ dân số, các bước đó là gì?

GV ngừng lại một lát để SV nhớ lại các bước trong KĐ giả thuyết TK và gọi một SV

trả lời câu hỏi

0H (giả thuyết không) và giả thuyết

AH (giả thuyết

3. SV: Bước 1 là đặt giả thuyết

thay thế). Bước 2 là sử dụng một phép kiểm để KĐ giả thuyết đặt ra. Bước 3 là dựa

0H .

vào quy tắc quyết định để kết luận chấp nhận hay bác bỏ giả thuyết

4. GV: Có em nào bổ sung thêm gì không? Trong các bước đó thì bước nào là quan

trọng nhất ?

5. SV: Bước 1 là quan trọng nhất vì nếu đặt giả thuyết sai thì sẽ dẫn đến kết luận

sai.

6. GV: Làm sao mình biết giả thuyết mình đặt là đúng hay sai?

SV này thể hiện sự lúng túng trong giây lát và sau đó phát biểu tiếp

7. SV: Mình phải đặt giả thuyết với mục đích bác bỏ, giả thuyết này phải đặt ngược

với mục đích nghiên cứu, giả thuyết này gọi là giả thuyết không, tức là không có sự

khác biệt.

GV đề nghị SV nói rõ hơn, SV nêu ra một VD.

8. SV: Ví dụ ở bài học trước, để so sánh hiệu quả của hai phương pháp điều trị bệnh

A ta so sánh tỷ lệ khỏi bệnh của hai phương pháp này bằng phép kiểm u. DL thu

thập được cho thấy tỷ lệ khỏi bệnh của hai phương pháp là khác nhau, muốn chứng

0H đối lập với DL thực tế: Tỷ lệ khỏi bệnh của hai

tỏ điều này mình đặt giả thuyết

:H p 0 1

p= 2

:AH p 1

p≠ 2

0H thì kết luận hiệu quả của hai phương pháp như nhau và nếu bác bỏ

0H thì kết

phương pháp không khác nhau, tức là và . Nếu chấp nhận

luận ngược lại.

GV khẳng định lại các phát biểu của SV và giới thiệu bài toán so sánh hai trung

bình.

9. GV: Trong nội dung KĐ giả thuyết TK về trung bình, có ba bài toán so sánh hai

trung bình:

Bài toán 1 là so sánh hai trung bình thực nghiệm độc lập, bài toán 2: So sánh hai

trung bình khi số liệu ghép cặp và bài toán 3 là so sánh trung bình thực nghiệm và

trung bình lý thuyết. Chúng ta sẽ lần lượt nghiên cứu các phương pháp để giải các

bài toán này. Trong buổi học hôm nay, chúng ta sẽ tập trung nghiên cứu lý thuyết và

thực hành giải bài toán 1: So sánh hai trung bình thực nghiệm độc lập.

Để so sánh hai trung bình ta sử dụng 2 phép kiểm là u và t. Vấn đề đặt ra là làm thế

nào để so sánh trung bình của hai dân số?

Ngừng lại một lát, GV tiếp tục:

10. Đương nhiên là chúng ta không thể khảo sát toàn bộ hai dân số đó để tính ra số

trung bình của đặc tính cần nghiên cứu. Các em đã học phương pháp của TK rồi, đó

là: Xác định cỡ mẫu, tiến hành lấy mẫu và sử dụng phương pháp KĐ giả thuyết TK

để so sánh hai trung bình. Cụ thể là ta phải lấy hai mẫu độc lập từ hai dân số đó và

so sánh hai trung bình thực nghiệm này để kết luận cho hai trung bình dân số. Để

thực hiện điều này ta chia bài toán thành 2 trường hợp: đã biết σ và chưa biết σ.

GV giải thích thêm về các trường hợp đã biết σ và chưa biết σ.

11. GV: Tương tự trong bài toán ước lượng khoảng tin cậy, σ đã biết khi đã có

nghiên cứu về đặc tính X mà chúng ta đang quan tâm hoặc trong y văn đã công bố

rồi. Chẳng hạn, quyển sách Các giá trị sinh học người Việt Nam bình thường thập

kỷ 90 - Thế kỷ XX cho biết chiều cao trung bình của nam thanh niên Việt Nam trên

18 tuổi là 163 cm và độ lệch chuẩn là 4 cm. Trong trường hợp này, khi nghiên cứu

về chiều cao của nam thanh niên Việt Nam chúng ta có thể coi như σ = 4 đã biết.

Ngược lại, những nghiên cứu mới thì chưa biết σ.

GV chiếu slide bài giảng

1. Nếu đã biết

2 2 ,σ σ 1 2

Để sánh hai số trung bình

,µ µ của hai dân số A và B có phân phối chuẩn, phương

1

2

2

sai lần lượt là

,σ σ . Lấy mẫu từ hai dân số đó, gọi

,x x lần lượt là số trung bình 1

2 1

2 2

của 2 mẫu đó.

Bước 1: Đặt giả thuyết

:AH µ µ≠

1

2

:H µ µ= 1 2

0

x 1

=

Bước 2: Theo H

0, ta có

u

~

N

(0,1)

x 2 2 2 σ σ + 1 2 n n 2 1

Bước 3: Quy tắc quyết định

- Nếu |u| ≤ 1,96 (hoặc 2,58) thì ta chấp nhận

0H

- Nếu |u| > 1,96 (hoặc 2,58) thì ta bác bỏ

0H , chấp nhận

AH , α = 0,05 (hoặc 0,01)

2. Nếu đã chưa biết

1 < 30, n

2 < 30

2 ,σ σ và n 2

2 1

Ta muốn sánh hai số trung bình

,µ µ của hai dân số A và B có phân phối chuẩn,

1

2

phương sai lần lượt là

,σ σ chưa biết. Muốn so sánh được thì ta phải giả sử

2 1

2 2

2 σ σ= 2

2 1

2

Lấy mẫu từ hai dân số đó, gọi

,x x lần lượt là số trung bình của 2 mẫu đó. 1

+

(

(

1)

n 1

2 s 2

=

Ước lượng

= =

σ σ σ 2

1

2 s 1 +

n 2 − 2

1) n 1

n 2

x 2

=

+

Theo

t

~

(

2)

0H , ta có

Student n 1

n 2

σ

+

x 1 1 n 1

1 n 2

+

- Nếu |t| ≤

thì ta chấp nhận

2)

t n ( α 1

n 2

0H

+

- Nếu |u| >

thì ta bác bỏ

2)

t n ( α 1

n 2

0H , chấp nhận

AH , α = 0,05 (hoặc 0,01)

30

30

n ≥ 1

n ≥ 2

2

2

30

30

và thì ta coi như đã biết phương sai 12. GV giải thích thêm: Nếu

n < 1

n < 2

1sσ =

2 1

2sσ =

2 2

và . Nếu và thì muốn so sánh được ta phải giả thiết

2 σ σ= 2

2 1

(

2)

(tức là có cùng độ phân tán), thay vào công thức của u và gọi biến mới là t

n 1

n+ 2

thì theo lý thuyết TK t ~ student .

Thí dụ 1: (Bài 13, tr.78, sách BT). Quan sát trọng lượng của 32 trẻ sơ sinh trai ta có:

X (kg)

2,2

2,5

2,8

3,2

3,4

3,7

Số trẻ

1

1

6

13

8

3

Quan sát trọng lượng trung bình của 30 trẻ sơ sinh gái ta có trọng lượng trung bình 3

kg; s = 0,3. Hỏi có sự khác nhau về trọng lượng trung bình của trẻ sơ sinh trai và gái

không?

Đặt giả thuyết:

:H µ µ= 1 2

0

:AH µ µ≠

1

2

2

2

nên

30

n ≥

30

GV trình bày 2 thí dụ trên slide

Vì 1

n ≥ 2

1sσ =

2 1

2sσ =

2 2

x 1

=

=

ta tính được

u

1,588

x 2 2 2 σ σ + 1 2 n n 2 1

Vì |u| < 1,96 nên ta chấp nhận

0H

Kết luận: Trọng lượng trung bình của trẻ sơ sinh trai và gái khác nhau không có ý

nghĩa.

và và

Thí dụ 2 : (Bài 15, tr.79- Sách BT) Hàm lượng Na+ trong máu của người có huyết áp

bình thường và người có huyết áp cao, số liệu thực nghiệm như sau :

Nhóm

Cỡ mẫu

Trung bình Độ lệch chuẩn

Huyết áp bình thường

15

144

6,2

Huyết áp cao

12

160

3,9

Kết luận ?

Đặt giả thuyết

:AH µ µ≠

:H µ µ= 1 2

0

1

2

+

(

1)

(

n 1

2 s 2

=

Ước lượng

= =

σ σ σ 2

1

2 s 1 +

n 2 − 2

1) n 1

n 2

x 2

=

= -7,77

t

σ

+

x 1 1 n 1

1 n 2

= 2,787 nên ta bác bỏ

t Vì |t| > 0,01(25)

0H , chấp nhận

AH

Kết luận: Hàm lượng Na+ trong máu của người có huyết áp bình thường và người có

huyết áp cao khác nhau có ý nghĩa.

= 5,31

GV để trống các kết qủa tính toán và yêu cầu SV tính các thông số cần thiết (bằng

máy tính bỏ túi) và thay số vào công thức để tính giá trị u và t.

Sau khi trình bày 2 thí dụ, GV đặt câu hỏi: Sự khác biệt trong hai thí dụ này là gì?

Sau một thời gian suy nghĩ (khoảng 3 phút), GV đề nghị 1 SV trả lời

13. SV: Sự khác biệt là trong thí dụ 1 thì cỡ mẫu lớn còn trong thí dụ 2 thì cỡ mẫu

nhỏ.

14. GV: Mặc dù cùng yêu cầu so sánh hai trung bình thực nghiệm độc lập nhưng cả

hai mẫu trong thí dụ 1 đều có cỡ n ≥ 30 nên ta sử dụng phép kiểm u, còn trong thí

dụ 2 cả hai mẫu đều có cỡ n < 30 nên ta sử dụng phép kiểm t như phần lý thuyết đã

trình bày.

?

15. SV: Khi sử dụng phép kiểm t, tại sao trong lý thuyết có yêu cầu muốn so sánh

2 σ σ= 2

2 1

được hai trung bình thì phải giả sử

16. GV: Đó là điều kiện của phép kiểm t, nó cũng giống như điều kiện của phép

kiểm u và Chi bình phương mà các em đã học trong bài trước đó.

,σ σ là phương sai của dân số, làm thế nào để kiểm tra được điều kiện đó?

2 1

2 2

17. SV:

18. GV: Đúng là như thế, không kiểm tra được trong bài học này vì chúng ta chưa

có công cụ nhưng trong bài học sau về phép kiểm F, chúng ta sẽ học phương pháp

so sánh hai phương sai bằng phép kiểm F.

2 σ σ= 2

2 1

19. SV: Vậy ta cứ coi như điều kiện đã được thỏa mãn?

20. GV: Đúng vậy, bài học sau sẽ có phương pháp để giải quyết vấn đề này.

21. SV: Câu hỏi của cả hai thí dụ vừa rồi là so sánh sự khác biệt của hai giá trị trung

bình, nếu có sự khác biệt thì ta cần biết trung bình nhóm nào lớn hơn. Chẳng hạn,

trong thí dụ 2 câu hỏi là: “Hàm lượng Na+ trong máu người có huyết áp cao có cao

hơn so với người có huyết áp bình thường không?” thì làm sao?

22. GV: Đây là một câu hỏi thú vị, chúng ta vẫn làm như bình thường và dẫn đến

0H , tức là sự khác biệt về hàm lượng Na+ trung bình

kết luận bác bỏ giả thuyết

trong máu người có huyết áp cao và người có huyết áp bình thường có ý nghĩa. Mặt

khác ta thấy trong thực nghiệm, trung bình về hàm lượng Na+ trong máu người có

huyết áp cao lớn hơn người có huyết áp bình thường. Từ đó có thể trả lời được câu

hỏi của bạn.

GV thể chế hóa các bước thực hiện bài toán so sánh hai trung bình thực nghiệm

độc lập thông qua hai thí dụ ở bài học này.

23. Trong bài học hôm nay các em đã biết giải quyết bài toán so sánh hai trung bình

thực nghiệm độc lập. Các bước thực hiện của bài toán này cũng giống như thực hiện

bài toán so sánh hai tỷ lệ. Điều khác biệt chỉ là điều kiện áp dụng của các phép kiểm

u và t, chúng ta cần chú ý để sử dụng phép kiểm phù hợp với yêu cầu của mỗi bài

toán.

GV cũng đưa ra đánh giá về kỹ thuật đã triển khai trong bài học

24. Mặc dù chưa bao quát hết các yêu cầu của mỗi bài toán nhưng kỹ thuật KĐ giả

thuyết TK mà chúng ta đã được học trong bài học này cơ bản đã giải quyết các tình

huống mà sau này chúng ta phải đối mặt. Nếu có thời gian các em nên tham khảo

thêm các tài liệu được liệt kê ở phần cuối của giáo trình để tìm hiểu thêm về KĐ giả

thuyết TK.

Cuối cùng, GV cho các phép kiểm để SV luyện tập ở nhà.

PHỤ LỤC 4. MỘT SỐ BÀI LÀM CỦA SV TRONG CÁC THỰC NGHIỆM

1. THỰC NGHIỆM CHƯƠNG 5 TRÊN ĐỐI TƯỢNG SINH VIÊN BÀI TOÁN 1

BÀI TOÁN 2

2. THỰC NGHIỆM CHƯƠNG 6 TRÊN ĐỐI TƯỢNG SINH VIÊN BÀI TOÁN 1

2. BÀI TOÁN 2

PHỤ LỤC 5

BIÊN BẢN CÁC TIẾT HỌC

THEO ĐỒ ÁN DẠY HỌC ĐÃ THIẾT KẾ

Lớp học được quan sát là một lớp học của SV năm thứ nhất, giờ học được quan

sát vào ngày 20/04/2012, từ 9h40’ đến 11h40’. Đây là biên bản quan sát hoạt động

của nhóm ở máy 42, 43. Phần in nghiêng là ghi chú của người quan sát.

1. GV bắt đầu bằng việc giới thiệu chương trình buổi học.

2. GV cho học sinh xem đoạn phim đã chuẩn bị sẵn, cả lớp tập trung theo dõi.

9h40’ học sinh bắt đầu xem phim, 9h55’ kết thúc phim

3. GV: Vừa rồi là một đoạn phim bài giảng về bệnh đái tháo đường. Bây giờ chúng

ta có một chút thời gian để thảo luận và tổng kết thông tin mà bác sĩ vừa trình

bày. Chúng ta xem những thông tin nào cần thiết, viết những câu kết luận thôi.

Ở trong này bác sĩ nói rất là nhiều đến nồng độ HbA1c đúng không? Các bạn

thảo luận với nhau để chúng ta tổng kết lại đoạn phim về nồng độ HbA1c của

nhóm người bị đái tháo đường và nhóm người không bị đái tháo đường. Thời

gian thảo luận bắt đầu.

− SV1: Dưới 6,5 thì bình thường

− SV2: Lớn hơn 6,5 thì…nếu điều trị thì giảm.

− SV1: Lượng HbA1c trong máu, bình thường thì không thay đổi. Nếu lượng

đường trong máu tăng thì nó sẽ làm tăng lượng HbA1c.

− SV2: Bình thường HbA1c không đổi, khi tăng thì HbA1c tỉ lệ thuận với

lượng đường huyết. Bắt đầu là cái gì đó… không nhớ…xét nghiệm bên

đường huyết đó…đường huyết…ban đầu là…bình thường thì nhỏ hơn

khoảng… Cái gì mà 110 đến một trăm hai mươi … nhớ rồi, từ 110-126 là rối

loạn.

(Còn các thông số thì sao?)

− SV1: thầy chỉ nói mình xét nồng độ HbA1c thôi mà.

− SV2: Như vậy bên lượng đường ghi là… hồi nãy nhớ là 100-110 là bình

thường, 110 – 126 bị rối loạn.

− SV1: Trên 110-126. Nếu tăng đến khoảng 90-180 thì bị rối loạn.

− SV1 ghi: Xét nghiệm đường huyết, khoảng từ 100-110: bình thường, 110-

126: rối loạn, > 126: đái tháo đường.

− SV2: Tiếp tục xét trong khoảng rối loạn.

− Nói chung nhỏ hơn 200

− SV1 ghi 168-200: rối loạn

10h3’ GV cho SV ngừng thảo luận

4. GV: Bây giờ chúng ta sẽ thống nhất lại và tôi gọi một vài nhóm cử đại diện lên

trình bày một số ý chính về đoạn phim bác sĩ vừa nói, nêu lên những kết luận

cuối cùng. GV yêu cầu một SV lên trình bày kết quả thảo luận nhóm.

5. SV: Qua những thông tin y học mà bác sĩ đưa ra thì nhóm em có những nhận

thức sau đây: bệnh tiểu đường có nhiều nguyên nhân. Có những nguyên nhân

không thay đổi được như giới tính, di truyền. Có nguyên nhân thay đổi được như

ít vận động, bị béo phì, rối loạn. Có nhiều biện pháp xét nghiệm để biết những

người nào bị bệnh tiểu đường như xét nghiệm đường huyết lúc đói hoặc xét

nghiệm nồng độ HbA1c. Kết luận ở đây là lượng HbA1c tỉ lệ với lượng đường

và ít thay đổi, cho nên xét nghiệm HbA1c thì đáng tin hơn, và nồng độ HbA1c ở

người bị bệnh đái tháo đường thì lớn hơn người bình thường.

6. GV: Như vậy, bạn đã đưa ra kết luận cuối cùng là nồng độ HbA1c của người bị

đái tháo đường thì cao hơn người không bị đái tháo đường, đúng không? Có

nhóm nào bổ sung gì không ?

Một SV giơ tay

7. GV: Nào, mời bạn

8. Một SV bổ sung: Nếu được điều trị tốt thì lượng HbA1c trở về bình thường hoặc

gần bình thường.

9. GV: Tức là đối với với những người bị đái tháo đường, nếu được điều trị đúng

thì nồng độ HbA1c sẽ trở về bình thường hoặc gần bình thường, đúng không?

Như vậy kết luận cuối cùng của chúng ta là gì? Các bạn, có nhóm nào có ý kiến

khác không?

10. GV: Không có ai có ý kiến khác nữa, phải không? Như vậy, có hai ý kiến đại

diện cho hai nhóm đưa ra ở đây, tôi xin nhắc lại. Các bạn đưa ra kết luận là nồng

độ HbA1c của những người bị đái tháo đường thì cao hơn nồng độ HbA1c của

những người không bị đái tháo đường. Và bổ sung thêm là nếu những người bị

đái tháo đường mà được điều trị đúng thì nồng độ HbA1c sẽ trở về bình thường

hoặc gần bình thường. Như vậy chúng ta sẽ ghi nhận những thông tin bác sĩ vừa

nói qua tóm tắt phần thảo luận của các bạn như phần trình bày của hai bạn vừa

rồi. Tôi sẽ phát cho các bạn một bài toán liên quan đến bệnh đái tháo đường mà

ở đây người ta đo nồng độ HbA1c của hai nhóm: một nhóm là những người bị

đái tháo đường và một nhóm là những người không bị đái tháo đường.

10h5’ kết thúc trao đổi của giáo viên và cả lớp đối với vấn đề này.

11. GV phát cho SV phiếu số 2 về nghiên cứu bệnh đái tháo đường.

12. GV: Những thông tin mà bác sĩ vừa trình bày như các bạn trong lớp đã tổng kết,

tôi tóm tắt lại trong khung hình đó. Các bạn đọc lại và đọc bài toán ở đây. Tức là

ở đây người ta đo hai mẫu: một mẫu là 28 người bị đái tháo đường và một mẫu

30 người không bị đái tháo đường. Một mẫu bị đái tháo đường, một mẫu không

bị đái tháo đường. Câu hỏi đặt ra là thông tin y học trên có đúng với hai mẫu DL

về đái tháo đường trong bài này không? Tức là những kết luận lúc nãy và với hai

mẫu DL này thì những thông tin trên có đúng với hai mẫu DL về đái tháo đường

trong bài toán này không?

13. GV: Bây giờ để trả lời câu hỏi đặt ra. Các bạn hãy cho biết chúng ta phải giải

quyết bài toán gì?

14. GV: Các bạn thảo luận và cho biết ý kiến. Bạn nào cho ý kiến?

15. SV: Thưa thầy, chúng ta phải KĐ giả thuyết thống kê về trung bình để trả lời

câu hỏi nồng độ HbA1c ở những người bị đái tháo đường có cao hơn nồng độ

HbA1c ở những người không bị đái tháo đường không.

16. GV: Tức là bạn nói bài toán KĐ giả thuyết thống kê là so sánh hai số trung bình

của mẫu bị đái tháo đường và mẫu không bị đái tháo đường qua nồng độ

HbA1c. Bạn nào có bổ sung gì nữa không?

17. GV: Để giải quyết bài toán so sánh hai trung bình, đề nghị các bạn thảo luận và

đưa ra các bước thực hiện.

− SV1: Nói chung là phải tính các thông số cần thiết rồi dùng phép kiểm t.

− SV2 : Phải tính trung bình và phương sai mẫu trước đã.

− Giờ đưa ra phương pháp giải:

− SV1 : Xem 2 mẫu có PPC không? Sau đó nếu có PPC rồi thì so sánh hai

phương sai. Để so sánh hai phương sai thì phải tính F.

− SV1: Mẫu nhỏ thì dùng phép kiểm t.

− SV2: Có cần phép kiểm chi bình phương ở đây không ?

− SV1 ghi:

2

s,

 Xem 2 mẫu có PPC không?

2 s 1

2

 Nếu có PPC, so sánh hai phương sai

 Nếu hai phương sai đồng nhất thì tính

 Dùng phép kiểm t

− SV1 lật giáo trình trang 142-143, sau đó tiếp tục ghi:

Giả thuyết H: là nồng độ ở người đái tháo đường > nồng độ ở người bình

thường.

2-1)s2 2

1 = σ

2 =

1-1)s2 1+(n 1+n n 2-2

A x

(n σ = σ

E

AαE(n

1+n

2-2)

E E E E E E A t =E ~ tE

1- x 2 1 n 1

σ + 1 n 2

18. GV nhắc: Chúng ta chưa cEần giải bài toán, mà chỉ nêu các bước giải.

− SV1: n ở đây là bao nhiêu ?

− SV2: là cỡ mẫu đó.

− SV1: Thầy có đưa ra công thức rồi.

(SV1 lật vở xem lại kiến thức)

− SV1: Vậy mình phải tính các thông số cần thiết, sau đó so sánh. Có máy tính

không?

SV2 lấy máy tính trong túi xách. Trong khi đó các SV nhóm bên cạnh đã bắt

đầu nhập DL vào máy tính.

− SV2 nhập DL vào máy tính, SV1 theo dõi. Sau đó SV1 ghi kết quả

,= 1X 7 989

. SV1 tỏ ý thắc mắc.

− SV2: Cứ ghi đi.

− SV2 nhâp DL vào máy tính để tính s, SV1 đọc DL cho SV2 nhập.

,=

2 247

. − SV2 đọc kết quả, SV1 ghi vào giấy s

− SV1: Tính cho nhóm 2 nữa đúng không ?

− SV1 đọc DL cho SV2 nhập vào máy và tính. Máy tính báo lỗi, không ra kết

quả. SV2 tự đọc DL và nhập.

µ ≥ µ

H

:

o

1

2

µ < µ

:

H 1

1

2

− SV1 ghi vào giấy trong lúc SV2 đang tính:

2-1)s2 2

1 = σ

2 =

1+(n 1-1)s2 1+n n 2-2

A x

(n σ = σA

AαE(n

E

1+n

2-2)

E E E E E E A ~ tE t =E

1- x 2 1 n 1

=

=

;

,

,

7 047 s 1 810

σ + 1 n 2

− SV2 đọc kết quả: x

19. GV chEo SV dừng làm việc nhóm. Thời điểm là 10h20’

20. GV: Bây giờ mời hai nhóm đại diện cho lớp trình bày các bước giải quyết bài

toán đặt ra ở đây là gì? Mời một bạn nhóm này.

21. SV trình bày: Các bước giải quyết bài toán này là

 Bước 1: Chúng ta phải kiểm tra tính chuẩn của hai mẫu DL. Tính

X X, 1

2

=

=

trung bình:

n

; 28 n

30

1

2

nên đây là mẫu nhỏ, chúng ta thực hiện  Bước 2: Vì

phép kiểm student. Trước hết ta kiểm tra tính đồng nhất của phương

sai và sử dụng phép kiểm student một đuôi để so sánh hai trung bình.

Từ kết quả của phép kiểm đó ta thực hiện bước thứ 4 là so sánh với

thông tin y học

GV mời một đại diện của nhóm khác.

22. SV trình bày: Theo những DL của bài toán trên thì nhóm em xin đưa ra kết quả

,

là:

, n n s s , 2

1

1

2

 Bước 1: Tính các thông số cần thiết như

2X X, 1

.  Bước 2: KĐ tính chuẩn của DL đối với biến

oH : DL có PPC.

- Đặt giả thuyết

oH thì mình chuyển bước 3.

- Nếu chấp nhận

 Bước 3: So sánh 2 phương sai.

- Đặt giả thuyết hai phương sai khác nhau không có ý nghĩa

- Nếu chấp nhận giả thuyết, tức là hai phương sai đồng nhất, thì mình sẽ

2X X, 1

tiếp tục so sánh hai giá trị trung bình bằng phép KĐ t 1 đuôi.

23. GV: Cám ơn 2 bạn đại diện cho lớp. Có bạn nào có ý kiến gì thêm không? Các

bước các bạn đưa ra như vậy có phù hợp chưa?

24. Một SV bổ sung: DL ban đầu phải đưa vào các khoảng, chia thành các khoảng

nồng độ.

25. GV: Bạn bổ sung thêm là phải đưa DL về bảng ghép lớp, đúng không? Đó là

một ý kiến. Còn bạn nào có ý kiến gì nữa không?

26. GV: Như vậy chúng ta không có ý kiến gì thêm. Tôi tạm kết lại các bước mà các

bạn đưa ra nhé! Một bạn có một ý kiến khác so với hai nhóm đã phát biểu là DL

đã cho phải chia thành khoảng, đúng không? Vậy mục đích chia để làm gì và

chia như thế nào? Có thể trả lời được không?

27. SV trình bày: Chia để thực hiện KĐ tính chuẩn của DL bằng phép kiểm chi bình

phương. Chia sao cho số người trong khoảng đó phải lớn hơn hoặc bằng 5

28. GV: Bạn nhớ nhầm sang điều kiện thực hiện phép kiểm chi bình phương rồi.

phép kiểm chi bình phương chỉ có hiệu lực tốt khi tần số lý thuyết n’ lớn hơn

hoặc bằng 5.

Bây giờ tôi sẽ tổng kết lại các bước mà các bạn vừa đưa ra.

29. GV chiếu slide tổng kết các bước thực hiện bài toán KĐGTTG

30. GV: Áp dụng cho bài toán so sánh hai trung bình

- Bước 1: tính tham số mẫu như trung bình, phương sai

- Bước 2: KĐ tính chuẩn của DL

- Bước 3: nếu DL có PPC thì thực hiện so sánh hai phương sai. Nếu hai phương

sai giống nhau thì thực hiện phép kiểm t để so sánh hai trung bình. Và chọn

phép kiểm phù hợp một đuôi hay hai đuôi.

Trong bài chúng ta chọn một đuôi hay hai đuôi?

31. SV đồng thanh: một đuôi.

32. GV: Tại sao một đuôi?

33. SV: Vì bài hỏi lượng HbA1c của nhóm này có cao hơn nhóm kia không.

34. GV: Trường hợp DL không chuẩn thì thực hiện hoán chuyển và thực hiện các

bước lại từ đầu. Bây giờ chúng ta thử thực hiện bước một.

35. GV: Làm cách nào để chúng ta thực hiện được bước 1? Nhập DL vào máy, đúng

không? Bây giờ, vấn đề còn lại là bước 2, KĐ tính chuẩn, thông thường chúng ta

dùng kĩ thuật nào, phương pháp nào để KĐ tính chuẩn của DL?

36. SV đồng thanh: phép kiểm chi bình phương.

37. GV: Trong bài này sử dụng chi bình phương có được không? Nếu được thì thực

hiện như thế nào?

38. SV1 lật giáo trình, trang 160, 161 (Chu Văn Thọ và tgk, 2011)

39. GV: À, phép kiểm chi bình phương. Chúng ta thử xem trong bài này nếu cho DL

thô như vậy thì chúng ta dùng phép kiểm chi bình phương có được không? Tại

sao được? Tại sao không? Bạn nào có ý kiến?

40. SV1 trả lời: Được

GV: Mời 1 SV.

41. Một SV trình bày: Theo em thì mình có thể sử dụng phép kiểm chi bình phương

từng điểm.

42. GV: phép kiểm chi bình phương từng điểm là như thế nào nhỉ? Bạn có thể nói rõ

hơn không? Trong giáo trình, trong bài học ở lớp có bài toán dạng đó hay

không?

SV không có câu trả lời.

43. GV: Có một bạn đưa ra một ý kiến về chia khoảng ghép lớp, chia khoảng thì bạn

nói là có sai số, nó sẽ bị mất mát thông tin, đúng không? Vì từ DL thô ban đầu

chuyển qua dạng bảng ghép lớp sẽ bị mất mát thông tin. Còn bạn đề nghị một

phương pháp là dùng DL điểm nhưng không có kỹ thuật để thực hiện.

44. GV: Vậy có khả thi hay không?

45. SV đồng thanh: Không ạ.

46. GV: Đề nghị các bạn có ý kiến khác? Tích cực hơn nào. Tức là kĩ thuật phép

kiểm chi bình phương ở đây có sử dụng được hay không?

47. SV trình bày: Theo em, dùng phép kiểm chi bình phương là được. Vì ở đây đề

cho cỡ mẫu là 28 và 30 mà KĐ chi bình phương phải chia khoảng DL gốc thành

bảng DL ghép lớp. Nếu sử dụng bảng số liệu gốc sẽ dài.

48. GV: Bạn nói sử dụng phép kiểm chi bình phương để KĐ tính chuẩn mà chúng ta

từng biết là khả thi nhưng DL ở đây người ta cho là DL gốc, không có bảng DL

ghép lớp nên khó thực hiện đúng không?

49. SV: Theo em nghĩ là nên chia DL thành từng lớp là khả thi hơn.

50. GV: À, chia bảng hả? Cuối cùng cũng về chia bảng. Chia làm sao? Kĩ thuật chia

DL thô thành DL ghép lớp có được học hay không? Giáo trình có phần nào cung

cấp kỹ thuật chia bảng DL hay không?

51. SV: Dạ không, nhưng mà không chia thì làm thế nào nhỉ?

52. SV: Dạ thưa thầy, trong bài giảng thì không có nhưng trong giáo trình em thấy

người ta chia bảng mỗi khoảng thường cách nhau 5 đến 10 đơn vị.

53. GV: Các phép kiểm và ví dụ trong giáo trình, sau khi thu thập DL thô, người ta

đã chia sẵn thành bảng ghép lớp nhưng không cung cấp kỹ thuật chia bảng cho

chúng ta. Như vậy cuối cùng kết luận ra sao? Có thực hiện được phép kiểm chi

bình phương hay không?

54. SV: Nếu phương pháp chia bảng chưa học thì không thực hiện được phép kiểm

chi bình phương ở đây.

55. GV: À, như vậy là không thực hiện được. Bước 2 của bài toán KĐ yêu cầu phải

KĐ tính chuẩn của DL bằng phép kiểm chi bình phương nhưng với DL thô thì

chưa có kỹ thuật để thực hiện. Như vậy, chúng ta gặp khó khăn ở chỗ này. Để

khắc phục điều này trong thực tế người ta phải có một biện pháp khác, đó là

dùng phép kiểm Shapiro trong phần mềm R.

56. GV giới thiệu phần mềm R (10h35’). Các bạn coi trên màn hình về kĩ thuật KĐ

tính chuẩn của DL bằng phép kiểm shapiro trong phần mềm R.

GV hướng dẫn SV sử dụng phần mềm R, các SV làm theo hướng dẫn của GV.

A, kết luận 0E

thì chấp nhận giả thuyết HA 0 05,> 57. GV: Theo quy tắc KĐ, nếu trị số p

DL có PPC và ngược lại.

10h50’ SV thực hiện KĐ, 10h55’ GV hỏi kết quả.

58. GV: Chúng ta KĐ thì kết quả như thế nào nhỉ?

0E

59. SV: Bác bỏ HA

60. GV : Đối với DL về lượng HbA1c của người bị đái tháo đường thì p < 0,05

0?

đúng không? Nhỏ hơn 0,05 thì chấp nhận hay bác bỏ H

0, tức là DL về lượng HbA1c của người đái tháo đường có PPC

61. SV : Bác bỏ H 0. 62. GV: Bác bỏ H

hay không?

63. SV: Dạ, không.

64. GV: Còn DL về lượng HbA1c của người không bị đái tháo đường?

65. SV: Có PPC

66. GV: Có. Như vậy ở đây một mẫu DL có PPC, một mẫu không có PPC. Với kết

quả KĐ tính chuẩn của DL thì có thỏa điều kiện của phép kiểm t không?

67. SV: Không thỏa.

68. GV: Không thỏa là do điều kiện gì? Mình có thể so sánh hai trung bình của một

biến có PPC và một biến không có PPC với nhau không?

69. Một SV: Phải hoán chuyển DL.

70. GV: Trong trường hợp DL không có PPC, thì mình phải làm thế nào?

Có 3 phương pháp thực hiện như sau. Phương pháp thứ nhất là tăng cỡ mẫu lên vì

theo định lý giới hạn trung tâm trong giáo trình, khi cỡ mẫu càng lớn thì DL sẽ có

PPC. Ví dụ ở đây cỡ mẫu là 28 và 30 phải không ? Tăng cỡ mẫu nhiều lên rồi mình

kiểm lại xem DL có PPC không. Bao giờ có PPC thì thôi. Như vậy phương pháp đó,

các bạn thấy có khả thi không?

71. SV: Không.

72. GV : Tại sao không khả thi

73. SV : Tại vì làm XN trên nhiều người hơn thì tốn tiền hơn.

74. GV: Đúng rồi. Thứ nhất là tốn thời gian thực hiện, thứ hai là đối với những xét

nghiệm y học có những xét nghiệm rất đắt tiền. Vừa tốn kém về thời gian, vừa

tốn kém về kinh phí thực hiện XN nên phương pháp tăng DL không khả thi,

đúng không?

75. GV: Phương pháp thứ hai là sử dụng những phép kiểm không đòi hỏi điều kiện

DL có PPC, phương pháp đó người ta gọi KĐ phi tham số, nhưng chúng ta

không được học, cho nên phương pháp KĐ phi tham số cũng không khả thi.

76. GV: Phương pháp thứ 3 là người ta hoán chuyển DL về PPC bằng một số hàm

toán học như hàm mũ, hàm căn bậc hai nhưng thông thường nhất là hàm

logarith. Ở đây tôi sẽ minh họa cho các bạn cách hoán chuyển DL bằng hàm

logarith. Tôi sẽ thực hiện hoán chuyển DL đối với mẫu thứ nhất, còn một mẫu

thứ hai thì các bạn tự làm nhé!

GV minh họa bằng cách hoán chuyển DL

77. GV: Đặt một biến để đón nhận giá trị mà nó hoán chuyển. Ví dụ ở đây đã đặt X,

Y rồi thì giờ mình đặt là Z. Đây, chỉ cần một câu lệnh này thôi

SV thực hiện theo hướng dẫn của GV

> Z1 <- c (log(X1))

> shapiro.test (Z1)

Vì p value lớn hơn 0,05 và theo lý thuyết thì sau hoán chuyển, DL Z1 có PPC.

78. GV: Các bạn làm tương tự với mẫu thứ hai.

79. SV1: Chuẩn rồi mà.

80. SV2: Mình phải chuyển cả hai mẫu vì nếu chỉ chuyển một mẫu thì nó không

cùng đơn vị.

81. SV1: Vậy chứ hoán chuyển cái gì?

SV2 gõ giúp SV1 lệnh hoán chuyển.

82. GV: Để tính trung bình và độ lệch chuẩn của hai mẫu DL đã hoán chuyển nhập

câu lệnh:

> mean (Z1)

[1] 2,045068

> sd (Z1)

[1] 0,2540067

GV yêu cầu SV ghi lại kết quả. SV thực hiện tương tự với mẫu 2.

83. GV: Các bạn thấy DL có PPC không?

84. SV: Có

85. GV: Có PPC. Vì p value lớn hơn 0,05 và theo lý thuyết thì DL Z2 đã hoán

chuyển có PPC. Như vậy đã thỏa hai điều kiện của KĐ t chưa?

86. SV: Dạ rồi.

87. GV: chúng ta thực hiện được so sánh hai trung bình chưa?

88. SV: Dạ rồi.

GV: Rồi. Bây giờ chúng ta sẽ làm bước tiếp theo là so sánh hai trung bình. Tôi sẽ

phát cho mỗi bạn một tờ giấy, giống như tờ giấy thi, các bạn ghi họ tên và làm bài

trong đó.

SV làm việc cá nhân

89. Một SV hỏi bài. SV1 trả lời: KĐ DL có PPC, phép kiểm t, quên, KĐ phương sai

xem có đồng nhất không chứ, sau đó so sánh hai trung bình.

90. SV3: Giờ chỉ KĐ phương sai thôi hả?

91. SV1: Ừ.

SV ghi lại các kết quả đã KĐ (trên slide trình chiếu) vào giấy làm bài.

SV2 dùng Excel, dùng hàm FINV: =finv(27;29;0,05). Kết quả máy báo NUM!

SV2 tham khảo bảng trang 246, 247, rồi trao đổi với bạn kế bên và chỉnh lại.

= finv(0,05;27;29)

Máy báo kết quả là 1,875131

92. SV2: 29 hay 39?

Sau một lát suy nghĩ, SV2 sửa lại là: = finv(0,05;27;39)

Máy báo kết quả là 1,77363

SV2 vẫn tiếp tục thắc mắc: 27, 29 hay 27, 39?

SV2 thử nghiệm: = finv(0,05;29;27). Máy báo kết quả là 1,875131

SV2 ghi kết quả vào giấy làm bài

93. GV: Giá trị ngưỡng đối với phép kiểm t một đuôi thì lấy giá trị này: 1,890674 và

1,672552 (có trình chiếu)

94. SV1: Số trên hay dưới?

95. SV2 thắc mắc: 29, 27 hay 27, 29?

96. SV1: 29, 27 đúng rồi.

oH . SV1 nhắc SV2 sửa lại.

SV1 kiểm tra lại bài và sửa lại: Vì T c> ⇒ bác bỏ

µ ≤ µ

H

o

2

: 1 µ > µ

:

H 1

1

2

2 SV làm xong bài, SV1 tiếp tục kiểm tra lại bài và sửa lại:

11h30’ GV yêu cầu lớp trưởng thu bài.

=

=

=

;

,

0 254 n

;

,

28

X 2 045068 s 1

1

1

=

=

=

0 27 n

30

X 1 917 s ,

;

;

,

2

2

2

97. GV gọi một SV lên bảng trình bày. SV trình bày như sau:

Ước lượng:

;

X 1

S 1

X

;

µ = 1 µ = 2

2

σ = 1 σ = 2

S 2

2

2

H : σ khác nhau không ý nghĩa.

2σ :

o

2

1σ và

=

=

<

=

F

, 1 1299 F

, 29 27

, 1 89

(

)

, 0 05

2

2 σ 1 σ

2

* KĐ so sánh

oH

2

+

n

(

(

1

) 1 S 2

2 σ =

=

⇒ chấp nhận

, 0 068

n

n 2 − 2

) 2 1 S 1 ( + n

− )

1

2

H : µ ≤ µ : đúng,

o

1

2

H : µ > µ 1 2

1

2

=

=

t

1 869 ,

2

+

σ

1 n

1

2

− X X 1   

  

=

=

v

25

1 672 ,

1 n )

(

α

= c T 2

t

c< (sau đó SV sửa lại là t

c> )

*

oH

⇒ bác bỏ

Vậy: nồng độ HbA1C của người tiểu đường cao hơn người bình thường.

98. GV yêu cầu SV tổng kết các bước.

99. GV thực hiện pha thể chế hóa.

Buổi thực nghiệm kết thúc lúc 11h40’

PHỤ LỤC 6

Bài toán 1 và 2 của thực nghiệm chương 5

Bài toán 1: Kết quả XN nồng độ HbA1c (%) trên hai nhóm:

Nhóm 1: Gồm 27 bệnh nhân bị tiểu đường type 2:

6.4, 6.4, 5.4, 6.0, 6.2, 8.1, 1.6, 7.1, 7.4, 6.1, 7.2, 7.2, 6.6, 7.9, 6.5, 6.8, 8.4, 7.5, 6.6,

7.7, 5.9, 7.6, 7.3, 10.6, 6.6, 6.1, 5.6.

Nhóm 2: Gồm 27 người bình thường (không bị tiểu đường):

5.1, 5.3, 5.0, 5.5, 5.5, 5.7, 5.4, 5.6, 5.4, 5.1, 5.3, 6.2, 5.9, 5.1, 5.3, 5.8, 5.9, 6.0, 6.2,

5.3, 5.4, 5.0, 5.1, 5.3, 6.9, 5.9, 5.6.

Câu hỏi: Nồng độ HbA1c của những người bị tiểu đường (nhóm 1) có cao

hơn nồng độ này ở những người bình thường không (nhóm 2)? (α =0,05)

Bài toán 2: Một nghiên cứu nhằm so sánh nồng độ lysozyme giữa hai nhóm

bệnh nhân. Nhóm 1 gồm 29 bệnh nhân, nhóm 2 gồm 30 bệnh nhân tuổi từ 20 đến

60. Số liệu như sau: (Nguyễn Văn Tuấn, 2010)

Nhóm 1: 0.2, 0.3, 0.4, 1.1, 2.0, 2.1, 3.3, 3.8, 4.5, 4.8, 4.9, 5.0, 5.3, 7.5, 9.8,

10.4, 10.9, 11.3, 12.4, 16.2, 17.6, 18.9, 20.7, 24.0, 25.4, 40.0, 42.2, 50.0, 60.0.

Nhóm 2: 0.2, 0.3, 0.4, 0.7, 1.2, 1.5, 1.5, 1.9, 2.0, 2.4, 2.5, 2.8, 3.6, 4.8, 4.8, 5.4,

5.7, 5.8, 7.5, 8.7, 8.8, 9.1, 10.3, 15.6, 16.1, 16.5, 16.7, 20.0, 20.7, 33.0.

Câu hỏi: So sánh nồng độ Lysozyme trung bình trong hai nhóm trên (α =0,05)

PHỤ LỤC 7

PHIẾU SỐ 1 VÀ 2

PHIẾU SỐ 1

(Bài toán 1 và 2 của thực nghiệm chương 6)

1 ng/ml) của một mẫu 44 người bị ung thư tiền

Bài toán 1: Lượng PSA (X

liệt tuyến (KT) có di căn như sau:

6.0, 7.3, 8.5, 8.9, 9.5, 11.9, 10.2, 11.3, 11.5, 11.4, 11.2, 12.5, 12.9, 13.0, 14.0, 13.8,

12.9, 14.8, 15.0, 15.5, 15.8, 15.7, 16.0, 15.0, 16.0, 16.2, 17.1, 18.0, 17.8, 16.9, 16.5,

2 ng/ml) của 27 người bị KT chưa di căn như sau:

17.4, 17.9, 18.5, 19.4, 19.6, 18.7, 18.3, 21.0, 22.5, 26.0, 29.1, 25.6, 25.8 Lượng PSA (X

8, 9, 9.1, 9.2, 9.5, 9.8, 10.7, 10.8, 11.2, 11.7, 11.8, 12.3, 12.5, 12.9, 13, 14, 14.5,

14.7, 15.5, 16, 16.4, 16.9, 17, 18, 19.1, 21, 21.8

1 = 15,747; s

1 = 5,051 và X

2 = 13,57; s

2 = 3,769

Tính được: X

Hỏi: Lượng PSA của người KT có di căn có cao hơn lượng PSA của người KT

chưa di căn không? (α = 0,05)

Bài toán 2: Nồng độ HbA1c của 28 người bị đái tháo đường type 2

12.2, 8.2, 5.9, 6.1, 8.3, 9.5, 6.3, 9.3, 7.5, 6.6, 7.8, 6.3, 7.7, 7.3, 6.5, 5.5, 6, 14.9, 7.5,

8.3, 7.4, 8.8, 12, 7.9, 10.9, 6.1, 5.1, 7.8

Nồng độ HbA1c của 30 người bình thường (không bị đái tháo đường)

8.1, 5.3, 5.0, 5.8, 9.5, 5.4, 10.0, 4.5, 8.8, 5.9, 6.2, 10.3, 7.1, 7.5, 9.2, 4.3, 8.8, 7.1,

6.4, 7.5, 7.3, 4.3, 10.1, 6.7, 9.3, 4.8, 5.8, 7.3, 8.2, 4.9

1 = 7,898; s

1 = 2,246 và X

2 = 7,047; s

2 = 1,86

Tính được: X

Hỏi: Nồng độ HbA1c của người bị đái tháo đường type 2 có cao hơn nồng

độ này ở người bình thường không? (α = 0,05)

HẾT

E(69) = 1,994; tE

A0,05

A0,05E(56) = 2; tE

A0,1E(69) = 1,667; tE

A0,1E(56) = 1,672

E A A A A Cho biết: t

A0,05E(27; 29) = 1,875; FE

A0,05E(43; 26) = 1,843

A A FE

PHIẾU SỐ 2

XÉT NGHIỆM PSA VÀ UNG THƯ TIỀN LIỆT TUYẾN

Hiện nay, dấu hiệu sinh học được dùng rộng rãi nhất trong tầm soát và phát

hiện ung thư là xét nghiệm tìm PSA (prostate-specific antigen: kháng nguyên đặc

hiệu tuyến tiền liệt) trong máu nam giới cao tuổi, để tầm soát ung thư tiền liệt tuyến.

Xét nghiệm PSA là xét nghiệm đơn giản, dễ thực hiện và tương đối chính

xác. Xét nghiệm này dùng để phát hiện một loại protein được phóng thích từ tiền

liệt tuyến vào máu. Xét nghiệm này được dùng song hành với việc khám tiền liệt

tuyến bằng ngón tay qua trực tràng.

Điều quan trọng nhất thường thấy là những người bị ung thư tiền liệt tuyến

có lượng PSA cao hơn so với những người không bị bệnh ung thư. Giá trị PSA càng

cao thì càng có khả năng mắc bệnh ung thư tiền liệt tuyến. Hơn nữa, mức PSA trong

máu càng có xu hướng tăng khi ung thư tiền liệt tuyến lan sang các cơ quan khác (di

căn) (Vũ Văn Vũ, 2011)