MỘT SỐ THUẬT TOÁN THỐNG KÊ THƯỜNG ĐƯỢC SỬ DỤNG TRONG<br />
DỊCH TỂ HỌC<br />
Giới thiệu: Chúng tôi thực hiện định hướng thực hành ở một số phương pháp và thuật<br />
toán mà nó có thể ứng dụng trong phân tích dữ liệu ban đầu. Khoảng tin cậy cho một tỷ lệ<br />
được mô tả, và test t được giới thiệu. Test x2 trình bày dài hơn, và test fisher nhận được<br />
sự chú ý. Cuối cùng, một số quan niệm nhầm lẫn phổ biến về test ý nghĩa được bàn luận.<br />
Đây không phải là một quyển sách thống kê, và đã có một số lượng lớn sách thống kê<br />
y học . Tuy nhiên, có một lượng lớn cách tính toán thống kê đơn giản mà nó thường dùng<br />
trong dịch tể học, và hầu hết có thể thực hiện trên một máy tính bỏ túi. Nó cho một cảm<br />
giác tự tin có thể tính một khoảng tin cậy cho dữ liệu đã thực hiện, hay có thể kiểm tra<br />
cách tính toán ở một số bài báo đã xuất bản. Chương này chỉ chứa một số thuật toán<br />
thống kê mà chính tôi thường thực hiện bằng tay.<br />
Hai thuật toán đã được giới thiệu trong các chương trước, chủ yếu làm thế nào để tính<br />
95% khoảng tin cậy cho nguy cơ tương đối gần đúng (odd ratios) và nguy cơ tương đối<br />
(relative risks). Điều này có thể thực hiện nhanh chóng và cho kết quả khoảng giới hạn có<br />
thể có của giá trị ORs và RRs, mặc dầu đối với một số nghiên cứu trong thực tiễn. việc<br />
đòi hỏi tất cả giá trị ở các ô trong bảng 2x2 phải có một giá trị 10 hay lớn hơn không<br />
phải lúc nào cũng được chấp thuận.<br />
Vấn đề khác không phải không phổ biến trong dịch tể học là ước tính khoảng tin cậy<br />
cho một tỷ lệ.<br />
Khoảng tin cậy cho một tỷ lệ<br />
Thông thường người ta muốn ước tính tỷ lệ của một quần thể có một số đặc trưng, như<br />
là tỷ lệ người có kháng thể với bệnh A, hay tỷ lệ của quần thể người thực hiện một test<br />
với bệnh B.Rất hiếm khi để có thể thực hiện test hay hỏi được mọi người, vì thế người ta<br />
chỉ có thể thực hiện điều này bằng cách thu thập một mẫu ngẫu nhiên.<br />
Giả dụ rằng mẫu này là ngẫu nhiên thực sự, không có sai số do chọn lựa, người ta<br />
muốn biết làm thế nào tỷ lệ được đo lường trong mẫu liên quan đến tỷ lệ hiện mắc thực<br />
trong quần thể. Đây là lý do tương tự chính xác khi chúng ta theo sau chương 4 đề cập<br />
đến khoảng tin cậy cho ORs: Nếu người ta chỉ muốn thực hiện một trình bày về mẫu chỉ<br />
nghiên cứu thì không cần thiết khoảng tin cậy. Nếu 31 đối tượng trong 100 thử nghiệm<br />
có kháng thể đối với bệnh A, thì tỷ lệ huyết thanh học trong nhóm này là 31%. Tuy<br />
nhiên, đây là một tình huống rất hiếm , và người ta muốn các kết quả có thể áp dụng đến<br />
một số quần thể lớn hơn.<br />
Người ta có cảm giác trực quan rằng kích thước của mẫu là quan trọng .Nếu 3 người<br />
trong một mẫu 10 người có kháng thể đối với viêm gan A thì ngẫu nhiên(chance) có thể<br />
giữ một vai trò quan trọng.Tỷ lệ huyết thanh thực trong quần thể có thể dễ dàng gần với<br />
20 hay 40%, và người ta chần chừ để chứng tỏ nó là 30%. Tuy nhiên, nếu chúng ta thực<br />
hiện mẫu 100 đối tượng trong một quần thể lớn hơn và thấy rằng 31 huyết thanh dương<br />
tính thì chúng ta cảm giác bảo đảm hơn về ước tính của khoảng 30% và ngay cả hơn như<br />
thế nếu 308 trong số 1000 mẫu thấy có kháng thể. Mẫu càng lớn thì càng ít có ảnh hưởng<br />
khi đưa vào cỡ mẫu nghiên cứu ngẫu nhiên một cặp “quá nhiều” hay “quá ít” huyết thanh<br />
dương tính.<br />
Khoảng tin cậy cho một quần thể là được tính toán theo cách sau:<br />
<br />
1. Viết số như một tỷ lệ thay vì phần trăm. Đối với mẫu cuối trong đoạn văn trên tỷ<br />
lệ là 0.308 ( 308 người trong 1000 được thử test)<br />
2. Gọi tỷ lệ này là p. Gọi tổng số đối tượng trong nghiên cứu là N.<br />
3. Tính số p x (1-p)/N. Trong ví dụ của chúng ta là : 0,308 x 0,692/1000.<br />
4. Tính căn bình phương của số này ngay:<br />
<br />
p(1 p)<br />
N<br />
<br />
hay trong ví dụ là<br />
<br />
0.308 X 0.692<br />
1000<br />
<br />
0.015<br />
<br />
5. Số này được gọi là sai số chuẩn của một tỷ lệ<br />
6. Ngay khi nhận được yếu tố sai số trong các chương trước, bây giờ chúng ta nhân<br />
sai số chuẩn với 2, và một lần nữa đây là một cách thống kê để tạo ra một khoảng<br />
tin cậy 95%<br />
2 x 0,015 = 0,030<br />
7. Tuy nhiên, lúc này chúng ta không chia và nhân với số cuối cùng mà thay vào đó<br />
trừ và cộng nó với tỷ lệ gốc (0,308 trong ví dụ)<br />
Cận dưới : 0,308-0,030 = 0,278.<br />
Cận trên : 0,308 +0,030 = 0,338.<br />
8. Diễn giải: Chúng ta giả dụ rằng chúng ta đã thực hiện một mẫu ngẫu nhiên thực<br />
sự ( không sai số) của 1000 người trong một quần thể lớn hơn nhiều. Trong ví dụ<br />
này chúng ta thấy rằng 308 đối tượng có dương tính với kháng thể của viêm gan<br />
A. Chúng ta có thể chứng tỏ rằng với xác suất 95% tỷ lệ huyết thanh học dương<br />
tính trong quần thể phải từ 27,8% và 33,8%.<br />
Quan sát mang tính dự báo về sai số: Nếu mẫu bị sai theo một cách thức nào đó thì tỷ<br />
lệ tính toán sẽ bị sai và khoảng tin cậy sẽ không còn có ý nghĩa. Nếu chúng ta hỏi 1000<br />
người và nếu họ đã được xét nghiệm chẩn đoán HIV, nhưng một số trong đó đã xét<br />
nghiệm HIV trả lời rằng họ chưa được xét nghiệm thì tỷ lệ tính toán của chúng ta trong<br />
tổng số quần thể nghiên cứu là quá thấp và thực tế này tình cờ đã điều chỉnh bằng cách<br />
thêm vào khoảng tin cậy một con số nào đó. Khoảng tin cậy chỉ cho biết ảnh hưởng có<br />
thể có của sự ngẫu nhiên ( hay sai số chọn mẫu)- nó không thể mong đợi để hiểu được ý<br />
tưởng của con người.<br />
Test có ý nghĩa.<br />
Ngày càng có nhiều ghi nhận hơn bởi các nhà nghiên cứu y học và thống kê rằng<br />
cách thông tin tốt nhất để chứng tỏ ý nghĩa thống kê của một giá trị được cho cũng là<br />
cách trình bày khoảng tin cậy. Trong các ví dụ về ORs và RRs ở các chương trước , hai<br />
điều hiển nhiên từ khoảng tin cậy<br />
1. Nếu 95% khoảng tin cậy không bao gồm 1 ( toàn bộ khoảng hoặc trên hoặc dưới<br />
1), thì chúng ta biết rằng có một xác suất tốt mà yếu tố nguy cơ đã nghiên cứu là<br />
thực sự liên quan đến bệnh, và rằng đây không chỉ là một phát hiện ngẫu nhiên.<br />
2. Độ lớn của khoảng tin cậy cho biết OR hay RR được đo lường chính xác trong<br />
nghiên cứu như thế nào. Nếu 95% khoảng tin cậy cho một RR là từ 1,3 đến 15, thì<br />
<br />
chúng ta không thực sự biết đây là một yếu tố nguy cơ rất quan trọng với bệnh<br />
(RR cao) hay một yếu tố nguy cơ tương đối nhẹ.<br />
Tuy nhiên, nhiều bài báo y khoa vẫn còn sử dụng test ý nghĩa thống kê cho những<br />
mục đích này, và có nhiều ví dụ thực khi khoảng tin cậy khó khăn để tính toán thì giá trị<br />
ý nghĩa có thể đạt được khá dễ dàng.<br />
Câu hỏi phổ biến nhất đằng sau tất cả test ý nghĩa là khả năng theo sau: Người ta<br />
chỉ quan sát một sự khác nhau giữa 2 nhóm bệnh (một nhóm có, ví dụ giá trị<br />
haemoglobin cao hơn, số phụ nữ cao hơn, tỷ lệ tấn công thấp hơn, thời gian ủ bệnh dài<br />
hơn, v.v). Có một điều gì đó xảy ra ngẫu nhiên, hay chỉ ra một sự khác biệt thực sự giữa 2<br />
nhóm?<br />
Lý thuyết thống kê được trình bày dưới đây cố gắng để trả lời câu hỏi này một phần<br />
mang tính khá phức tạp, và thông thường các test ý nghĩa trong tình huống đời sống thực<br />
sự điều không chắc rằng các giả dụ lý thuyết cần thiết đáp ứng các test như thế có thể<br />
đảm bảo. Hơn nữa, tồn tại triết lý liên quan đến giá trị xác suất thực sự có ý nghĩa như<br />
thế nào trong tình huống này. Chúng ta sẽ cố gắng đi từ những bàn luận như thế nhưng<br />
chỉ chỉ ra rằng với bất kỳ biến số đo được trên một nhóm người, có một vài loại thay đổi<br />
ngẫu nhiên giữa các đối tượng. Câu hỏi trên trở nên: có sự khác nhau được quan sát giữa<br />
các nhóm chỉ do sự biến thiên này, vì thế mà người có giá trị cao xảy ra kết thúc trong<br />
một nhóm và người có giá trị thấp trong nhóm khác? Hay điều không chắc rằng tính ngẫu<br />
nhiên có thể được chia một nhóm đồng nhất thành 2 nhóm phân tách bên ngoài?<br />
Có 2 tình huống khác nhau cơ bản có thể:<br />
1. Chúng ta đo lường giá trị của biến liên tục cho tất cả các thành viên trong 2 nhóm.<br />
Đây có thể là chiếu cao của họ, giá trị haemoglobin của họ, tuổi của họ, nhiệt độ<br />
của họ…. Tất cả các biến số này có cái chung là họ có thể giả dụ, ít nhất là về<br />
nguyên lý, bất kỳ giá trị trên đường liên tục. Điều này không hoàn toàn thực sự<br />
bởi vì chúng ta có khả năng ghi nhận toàn bộ chiều cao theo centimetre , hay<br />
nhiệt độ chỉ cách nhau 0,1oC nhưng về mặt lý thuyết chúng là các biến liên tục.<br />
Với mỗi một trong 2 nhóm chúng ta có thể tính toán giá trí trung bình rồi so sánh<br />
chúng.<br />
2. Người được phân nhóm chia thành 2 loại, như là phơi nhiễm/không phơi nhiễm;<br />
ốm/khỏe, nam/nữ, già hơn/ trẻ hơn… Sau đó chúng ta nhìn vào 2 nhóm bệnh nhân<br />
để thấy nếu có bất kỳ sự khác nhau nào trong tỷ lệ phơi nhiễm/không phơi nhiễm,<br />
ốm/khỏe, nam/nữ… giữa chúng.<br />
Test t<br />
Trong tình huống đầu tiên ở trên với các dữ liệu liên tục, người ta sử dụng test t<br />
(Student’s) để quyết định sự khác biệt có ý nghĩa thống kê giữa 2 nhóm. Các chương<br />
trình thống kê cơ bản nhất cho máy tính cá nhân có thể thực hiện điều này rất đơn<br />
giản:người ta chỉ nhập vào các giá trị cho một của các nhóm bệnh vào trong một cột , và<br />
các giá trị cho nhóm khác vào cột kế tiếp, và chương trình đưa ra xác suất ( giá trị p) mà<br />
tính ngẫu nhiên riêng lẽ gây ra một sự khác biệt lớn bằng hoặc lớn hơn giá trị quan sát<br />
thực sự. Giá trị p càng nhỏ thì càng ít có khả năng đây là một sự ngẫu nhiên, và giá trị p<br />
càng lớn thì càng nhiều khả năng có sự khác nhau thực sự giữa 2 nhóm.<br />
Cách để thực hiện một test t<br />
1.Gọi các nhóm là 1 và 2. Số lượng các đối tượng trong các nhóm là n1 và n2<br />
2. Giá trị trung bình cho nhóm thứ nhất ( ví dụ giá trị của haemoglobin) được gọi là m1,<br />
và m2 cho nhóm thứ 2.<br />
<br />
3. Tính độ lệch chuẩn của các giá trị trong 2 nhóm riêng lẽ: với nhóm thứ nhất, trừ m1 từ<br />
mỗi một giá trị, bình phương sự khác nhau này, và cộng tất cả các bình phương. Rồi chia<br />
số này cho (n-1) và thực hiện căn bậc hai của số này. Kết quả cuối cùng là độ lệch chuẩn<br />
của các giá trị trong nhóm 1, và được gọi là S1. Công thức toán học.<br />
( xi m1 ) 2<br />
(n 1)<br />
1<br />
1<br />
n<br />
<br />
S1 =<br />
<br />
vậy.<br />
<br />
Trong đó xi là tất cả các cá thể đo lường của nhóm. Rồi tính S2 cũng theo cách như<br />
<br />
Độ lệch chuẩn là một cách mô tả các giá trị phân bố chụm như thế nào trong một<br />
nhóm xung quanh giá trị trung bình. Độ lệch chuẩn thấp nghĩa là tất cả các giá trị phân<br />
bố chụm lại gần giá trị trung bình. Độ lệch chuẩn cao cho biết các giá trị đo được phân<br />
tán xa giá trị trung bình.<br />
4. Người ta cũng cần kết hợp độ lệch chuẩn cho cả 2 nhóm<br />
Đây được gọi là Sp, và được tính như sau<br />
(n1-1)S12 + (n2 – 1)s22<br />
Sp2=<br />
n1 + n2 - 2<br />
5. Bài toán cuối cùng chúng ta muốn được gọi là t, và được xác định như sau :<br />
<br />
m1-m2<br />
t=<br />
sp 1/ n1 1/ n2<br />
<br />
6. Giá trị t này rồi được thực hiện theo một bảng đã làm sẵn của ts, và hầu hết được<br />
tìm thấy ở phần cuối trong hầu hết các sách thống kê. Mức ý nghĩa thực sự khác nhau<br />
với các kích thước của 2 nhóm nhưng như quy luật chung của ngón tay cái, một giá trị t<br />
trên 2 nghĩa là có 5% ngẫu nhiên hay ít hơn rằng sự khác biệt này giữa 2 giá trị trung<br />
bình sẽ nảy sinh chỉ bởi ngẫu nhiên.<br />
Người ta thấy rằng tiến hành một test t trở nên khá khó khăn ngay cả với những<br />
mẫu tương đối nhỏ. Người ta phải sử dụng máy vi tính để làm, và những chỉ dẫn ở trên<br />
được bao gồm hơn để chứng minh làm thế nào nó thực sự đang được thực hiện.<br />
Tuy nhiên, có 2 điều hiển nhiên xảy ra . Giá trị t càng cao thì xác suất mà sự khác<br />
biệt quan sát được giữa giá trị trung bình của hai nhóm là một kết quả ngẫu nhiên càng<br />
nhỏ. Từ công thức cuối cùng có thể thấy rằng sự khác nhau giữa các trị trung bình càng<br />
lớn thì giá trị t sẽ càng cao.Thêm nữa, đo lường kết hợp sự lan tỏa xung quanh giá trị<br />
trung bình nhỏ hơn (Sp) thì giá trị t sẽ cao hơn. Một sự khác nhau nhỏ giữa 2 nhóm có thể<br />
khá ý nghĩa nếu độ lệch chuẩn là thấp, trái lại một sự khác nhau lớn giữa 2 nhóm với độ<br />
lệch chuẩn cao có thể chỉ là phát hiện ngẫu nhiên.<br />
Có một giới hạn khi sử dụng test t : nếu độ lệch chuẩn của 2 nhóm rất khác nhau<br />
(một là lớn hơn hai lần cái khác) thì test t phải không được thực hiện như đã mô tả ở trên<br />
<br />
. Tuy nhiên chương trình thống kê mà anh yêu thích có thể có 1 test giá trị đôi khi, hay tư<br />
vấn một nhà thống kê học, bởi vì sự lan tỏa rất khác nhau trong 2 nhóm có nghĩa là anh<br />
phải quan tâm hơn khi so sánh hai trị trung bình.<br />
Test Chi 2.<br />
Ở phần 2 của 2 ví dụ trên, chúng ta không có đo lường một số biến liên tục của 2 nhóm<br />
mà thay vì các thành viên của người thuộc các loại khác nhau . Điều này trở nên hơi lạ để<br />
nói về “ giới tính trung bình” trong một nhóm bệnh nhân. Tình huống cơ bản là bảng 2x2<br />
quen thuộc, mà có thể đây là một ví dụ:<br />
Tiêm chủng<br />
Ốm<br />
Khoẻ<br />
<br />
Không tiêm chủng<br />
<br />
10<br />
80<br />
90<br />
<br />
40<br />
20<br />
60<br />
<br />
50<br />
100<br />
150<br />
<br />
Tuy nhiên bảng 2x2 dễ dàng mở rộng tới một bảng có nhiều cột hơn và hay nhiều<br />
hàng hơn nếu có nhiều loại phơi nhiễm hay kết quả hay cả hai.<br />
Trong tình huống này, các đối tượng chỉ có thể thuộc hai loại: tiêm chủng hay<br />
không tiêm chủng, và hoặc là hai loại ốm và khỏe. Cách này không có ý nghĩa khi cho<br />
một giá trị sức khỏe trung bình trong nhóm được tiêm chủng, hay một tình trạng tiêm<br />
chủng trung bình trong nhóm khỏe mạnh .Loại dữ liệu này như thế là khá khác với test t<br />
ở trên, và thường được gọi là biến phân hạng ngược với biến liên tục.<br />
Trong chương 4, chúng ta đã thấy cách tính một OR đối với 1 bảng như thế, và<br />
khoảng tin cậy với giá trị này. Nếu chúng ta muốn thực hiện một test có ý nghĩa thống kê<br />
thay vì, câu hỏi để hỏi là: loại xác suất gì mà 150 đối tượng nghiên cứu phân chia cách<br />
này thành ốm và khỏe mạnh chỉ bởi tính ngẫu nhiên?Một xác suất rất thấp của một sự<br />
ngẫu nhiên như thế sẽ làm gia tăng trọng lượng đến giả thiết của chúng ta là vaccin có<br />
hiệu quả.<br />
Cách giải thích như sau: có 50 người bị ốm và 100 người vẫn còn khỏe mạnh.<br />
Nếu vaccin là không có hiệu quả toàn bộ, chúng ta sẽ giả định rằng nó chẳng là vấn đề gì<br />
dù một đối tượng đã tiêm chủng hay không. Bởi vì 1/3 trong tổng số bị ốm, đây sẽ là tỷ lệ<br />
mong muốn trong mỗi nhóm cá thể. Trong nhóm 90 người được chủng vaccin, chúng ta<br />
mong muốn 30 người bị ốm, và trong nhóm không chủng vaccin sẽ là 60, 20. Bảng kỳ<br />
vọng 2x2 nếu vaccin không có tác dụng chút nào sẽ là<br />
Bảng kỳ vọng<br />
Ốm<br />
Khoẻ<br />
<br />
Tiêm chủng<br />
30<br />
60<br />
90<br />
<br />
không tiêm chủng<br />
20<br />
40<br />
60<br />
<br />
50<br />
100<br />
150<br />
<br />
Cách chung để tính giá trị mong muốn cho một ô trong bảng 2x2 ( hay 3x3, hay<br />
5x3…) là nhân tổng cột ở đáy của cột tương ứng với tổng số hàng ở bên phải, rồi chia số<br />
này với tổng ở góc bên phải thấp hơn. Đối với ô đầu tiên trong ví dụ sẽ là 90x50/150 =30,<br />
<br />