Một số thuật toán thống kê thường được sử dụng trong dịch tễ học

Chia sẻ: Lavie Lavie | Ngày: | Loại File: PDF | Số trang:10

Thêm vào BST

Báo xấu

347
lượt xem 14
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Một số thuật toán thống kê thường được sử dụng trong dịch tễ học bao gồm những nội dung về khoảng tin cậy cho một tỷ lệ, Test có ý nghĩa, cách để thực hiện một test t, test một phía và test 2 phía, một số điều chú ý về các test thống kê.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Một số thuật toán thống kê thường được sử dụng trong dịch tễ học

MỘT SỐ THUẬT TOÁN THỐNG KÊ THƯỜNG ĐƯỢC SỬ DỤNG TRONG DỊCH TỂ HỌC Giới thiệu: Chúng tôi thực hiện định hướng thực hành ở một số phương pháp và thuật toán mà nó có thể ứng dụng trong phân tích dữ liệu ban đầu. Khoảng tin cậy cho một tỷ lệ được mô tả, và test t được giới thiệu. Test x2 trình bày dài hơn, và test fisher nhận được sự chú ý. Cuối cùng, một số quan niệm nhầm lẫn phổ biến về test ý nghĩa được bàn luận. Đây không phải là một quyển sách thống kê, và đã có một số lượng lớn sách thống kê y học . Tuy nhiên, có một lượng lớn cách tính toán thống kê đơn giản mà nó thường dùng trong dịch tể học, và hầu hết có thể thực hiện trên một máy tính bỏ túi. Nó cho một cảm giác tự tin có thể tính một khoảng tin cậy cho dữ liệu đã thực hiện, hay có thể kiểm tra cách tính toán ở một số bài báo đã xuất bản. Chương này chỉ chứa một số thuật toán thống kê mà chính tôi thường thực hiện bằng tay. Hai thuật toán đã được giới thiệu trong các chương trước, chủ yếu làm thế nào để tính 95% khoảng tin cậy cho nguy cơ tương đối gần đúng (odd ratios) và nguy cơ tương đối (relative risks). Điều này có thể thực hiện nhanh chóng và cho kết quả khoảng giới hạn có thể có của giá trị ORs và RRs, mặc dầu đối với một số nghiên cứu trong thực tiễn. việc đòi hỏi tất cả giá trị ở các ô trong bảng 2x2 phải có một giá trị 10 hay lớn hơn không phải lúc nào cũng được chấp thuận. Vấn đề khác không phải không phổ biến trong dịch tể học là ước tính khoảng tin cậy cho một tỷ lệ. Khoảng tin cậy cho một tỷ lệ Thông thường người ta muốn ước tính tỷ lệ của một quần thể có một số đặc trưng, như là tỷ lệ người có kháng thể với bệnh A, hay tỷ lệ của quần thể người thực hiện một test với bệnh B.Rất hiếm khi để có thể thực hiện test hay hỏi được mọi người, vì thế người ta chỉ có thể thực hiện điều này bằng cách thu thập một mẫu ngẫu nhiên. Giả dụ rằng mẫu này là ngẫu nhiên thực sự, không có sai số do chọn lựa, người ta muốn biết làm thế nào tỷ lệ được đo lường trong mẫu liên quan đến tỷ lệ hiện mắc thực trong quần thể. Đây là lý do tương tự chính xác khi chúng ta theo sau chương 4 đề cập đến khoảng tin cậy cho ORs: Nếu người ta chỉ muốn thực hiện một trình bày về mẫu chỉ nghiên cứu thì không cần thiết khoảng tin cậy. Nếu 31 đối tượng trong 100 thử nghiệm có kháng thể đối với bệnh A, thì tỷ lệ huyết thanh học trong nhóm này là 31%. Tuy nhiên, đây là một tình huống rất hiếm , và người ta muốn các kết quả có thể áp dụng đến một số quần thể lớn hơn. Người ta có cảm giác trực quan rằng kích thước của mẫu là quan trọng .Nếu 3 người trong một mẫu 10 người có kháng thể đối với viêm gan A thì ngẫu nhiên(chance) có thể giữ một vai trò quan trọng.Tỷ lệ huyết thanh thực trong quần thể có thể dễ dàng gần với 20 hay 40%, và người ta chần chừ để chứng tỏ nó là 30%. Tuy nhiên, nếu chúng ta thực hiện mẫu 100 đối tượng trong một quần thể lớn hơn và thấy rằng 31 huyết thanh dương tính thì chúng ta cảm giác bảo đảm hơn về ước tính của khoảng 30% và ngay cả hơn như thế nếu 308 trong số 1000 mẫu thấy có kháng thể. Mẫu càng lớn thì càng ít có ảnh hưởng khi đưa vào cỡ mẫu nghiên cứu ngẫu nhiên một cặp “quá nhiều” hay “quá ít” huyết thanh dương tính. Khoảng tin cậy cho một quần thể là được tính toán theo cách sau: 1. Viết số như một tỷ lệ thay vì phần trăm. Đối với mẫu cuối trong đoạn văn trên tỷ lệ là 0.308 ( 308 người trong 1000 được thử test) 2. Gọi tỷ lệ này là p. Gọi tổng số đối tượng trong nghiên cứu là N. 3. Tính số p x (1-p)/N. Trong ví dụ của chúng ta là : 0,308 x 0,692/1000. 4. Tính căn bình phương của số này ngay: p(1  p) N hay trong ví dụ là 0.308 X 0.692 1000  0.015 5. Số này được gọi là sai số chuẩn của một tỷ lệ 6. Ngay khi nhận được yếu tố sai số trong các chương trước, bây giờ chúng ta nhân sai số chuẩn với 2, và một lần nữa đây là một cách thống kê để tạo ra một khoảng tin cậy 95% 2 x 0,015 = 0,030 7. Tuy nhiên, lúc này chúng ta không chia và nhân với số cuối cùng mà thay vào đó trừ và cộng nó với tỷ lệ gốc (0,308 trong ví dụ) Cận dưới : 0,308-0,030 = 0,278. Cận trên : 0,308 +0,030 = 0,338. 8. Diễn giải: Chúng ta giả dụ rằng chúng ta đã thực hiện một mẫu ngẫu nhiên thực sự ( không sai số) của 1000 người trong một quần thể lớn hơn nhiều. Trong ví dụ này chúng ta thấy rằng 308 đối tượng có dương tính với kháng thể của viêm gan A. Chúng ta có thể chứng tỏ rằng với xác suất 95% tỷ lệ huyết thanh học dương tính trong quần thể phải từ 27,8% và 33,8%. Quan sát mang tính dự báo về sai số: Nếu mẫu bị sai theo một cách thức nào đó thì tỷ lệ tính toán sẽ bị sai và khoảng tin cậy sẽ không còn có ý nghĩa. Nếu chúng ta hỏi 1000 người và nếu họ đã được xét nghiệm chẩn đoán HIV, nhưng một số trong đó đã xét nghiệm HIV trả lời rằng họ chưa được xét nghiệm thì tỷ lệ tính toán của chúng ta trong tổng số quần thể nghiên cứu là quá thấp và thực tế này tình cờ đã điều chỉnh bằng cách thêm vào khoảng tin cậy một con số nào đó. Khoảng tin cậy chỉ cho biết ảnh hưởng có thể có của sự ngẫu nhiên ( hay sai số chọn mẫu)- nó không thể mong đợi để hiểu được ý tưởng của con người. Test có ý nghĩa. Ngày càng có nhiều ghi nhận hơn bởi các nhà nghiên cứu y học và thống kê rằng cách thông tin tốt nhất để chứng tỏ ý nghĩa thống kê của một giá trị được cho cũng là cách trình bày khoảng tin cậy. Trong các ví dụ về ORs và RRs ở các chương trước , hai điều hiển nhiên từ khoảng tin cậy 1. Nếu 95% khoảng tin cậy không bao gồm 1 ( toàn bộ khoảng hoặc trên hoặc dưới 1), thì chúng ta biết rằng có một xác suất tốt mà yếu tố nguy cơ đã nghiên cứu là thực sự liên quan đến bệnh, và rằng đây không chỉ là một phát hiện ngẫu nhiên. 2. Độ lớn của khoảng tin cậy cho biết OR hay RR được đo lường chính xác trong nghiên cứu như thế nào. Nếu 95% khoảng tin cậy cho một RR là từ 1,3 đến 15, thì chúng ta không thực sự biết đây là một yếu tố nguy cơ rất quan trọng với bệnh (RR cao) hay một yếu tố nguy cơ tương đối nhẹ. Tuy nhiên, nhiều bài báo y khoa vẫn còn sử dụng test ý nghĩa thống kê cho những mục đích này, và có nhiều ví dụ thực khi khoảng tin cậy khó khăn để tính toán thì giá trị ý nghĩa có thể đạt được khá dễ dàng. Câu hỏi phổ biến nhất đằng sau tất cả test ý nghĩa là khả năng theo sau: Người ta chỉ quan sát một sự khác nhau giữa 2 nhóm bệnh (một nhóm có, ví dụ giá trị haemoglobin cao hơn, số phụ nữ cao hơn, tỷ lệ tấn công thấp hơn, thời gian ủ bệnh dài hơn, v.v). Có một điều gì đó xảy ra ngẫu nhiên, hay chỉ ra một sự khác biệt thực sự giữa 2 nhóm? Lý thuyết thống kê được trình bày dưới đây cố gắng để trả lời câu hỏi này một phần mang tính khá phức tạp, và thông thường các test ý nghĩa trong tình huống đời sống thực sự điều không chắc rằng các giả dụ lý thuyết cần thiết đáp ứng các test như thế có thể đảm bảo. Hơn nữa, tồn tại triết lý liên quan đến giá trị xác suất thực sự có ý nghĩa như thế nào trong tình huống này. Chúng ta sẽ cố gắng đi từ những bàn luận như thế nhưng chỉ chỉ ra rằng với bất kỳ biến số đo được trên một nhóm người, có một vài loại thay đổi ngẫu nhiên giữa các đối tượng. Câu hỏi trên trở nên: có sự khác nhau được quan sát giữa các nhóm chỉ do sự biến thiên này, vì thế mà người có giá trị cao xảy ra kết thúc trong một nhóm và người có giá trị thấp trong nhóm khác? Hay điều không chắc rằng tính ngẫu nhiên có thể được chia một nhóm đồng nhất thành 2 nhóm phân tách bên ngoài? Có 2 tình huống khác nhau cơ bản có thể: 1. Chúng ta đo lường giá trị của biến liên tục cho tất cả các thành viên trong 2 nhóm. Đây có thể là chiếu cao của họ, giá trị haemoglobin của họ, tuổi của họ, nhiệt độ của họ…. Tất cả các biến số này có cái chung là họ có thể giả dụ, ít nhất là về nguyên lý, bất kỳ giá trị trên đường liên tục. Điều này không hoàn toàn thực sự bởi vì chúng ta có khả năng ghi nhận toàn bộ chiều cao theo centimetre , hay nhiệt độ chỉ cách nhau 0,1oC nhưng về mặt lý thuyết chúng là các biến liên tục. Với mỗi một trong 2 nhóm chúng ta có thể tính toán giá trí trung bình rồi so sánh chúng. 2. Người được phân nhóm chia thành 2 loại, như là phơi nhiễm/không phơi nhiễm; ốm/khỏe, nam/nữ, già hơn/ trẻ hơn… Sau đó chúng ta nhìn vào 2 nhóm bệnh nhân để thấy nếu có bất kỳ sự khác nhau nào trong tỷ lệ phơi nhiễm/không phơi nhiễm, ốm/khỏe, nam/nữ… giữa chúng. Test t Trong tình huống đầu tiên ở trên với các dữ liệu liên tục, người ta sử dụng test t (Student’s) để quyết định sự khác biệt có ý nghĩa thống kê giữa 2 nhóm. Các chương trình thống kê cơ bản nhất cho máy tính cá nhân có thể thực hiện điều này rất đơn giản:người ta chỉ nhập vào các giá trị cho một của các nhóm bệnh vào trong một cột , và các giá trị cho nhóm khác vào cột kế tiếp, và chương trình đưa ra xác suất ( giá trị p) mà tính ngẫu nhiên riêng lẽ gây ra một sự khác biệt lớn bằng hoặc lớn hơn giá trị quan sát thực sự. Giá trị p càng nhỏ thì càng ít có khả năng đây là một sự ngẫu nhiên, và giá trị p càng lớn thì càng nhiều khả năng có sự khác nhau thực sự giữa 2 nhóm. Cách để thực hiện một test t 1.Gọi các nhóm là 1 và 2. Số lượng các đối tượng trong các nhóm là n1 và n2 2. Giá trị trung bình cho nhóm thứ nhất ( ví dụ giá trị của haemoglobin) được gọi là m1, và m2 cho nhóm thứ 2. 3. Tính độ lệch chuẩn của các giá trị trong 2 nhóm riêng lẽ: với nhóm thứ nhất, trừ m1 từ mỗi một giá trị, bình phương sự khác nhau này, và cộng tất cả các bình phương. Rồi chia số này cho (n-1) và thực hiện căn bậc hai của số này. Kết quả cuối cùng là độ lệch chuẩn của các giá trị trong nhóm 1, và được gọi là S1. Công thức toán học. ( xi  m1 ) 2  (n  1) 1 1 n S1 = vậy. Trong đó xi là tất cả các cá thể đo lường của nhóm. Rồi tính S2 cũng theo cách như Độ lệch chuẩn là một cách mô tả các giá trị phân bố chụm như thế nào trong một nhóm xung quanh giá trị trung bình. Độ lệch chuẩn thấp nghĩa là tất cả các giá trị phân bố chụm lại gần giá trị trung bình. Độ lệch chuẩn cao cho biết các giá trị đo được phân tán xa giá trị trung bình. 4. Người ta cũng cần kết hợp độ lệch chuẩn cho cả 2 nhóm Đây được gọi là Sp, và được tính như sau (n1-1)S12 + (n2 – 1)s22 Sp2= n1 + n2 - 2 5. Bài toán cuối cùng chúng ta muốn được gọi là t, và được xác định như sau : m1-m2 t= sp 1/ n1  1/ n2 6. Giá trị t này rồi được thực hiện theo một bảng đã làm sẵn của ts, và hầu hết được tìm thấy ở phần cuối trong hầu hết các sách thống kê. Mức ý nghĩa thực sự khác nhau với các kích thước của 2 nhóm nhưng như quy luật chung của ngón tay cái, một giá trị t trên 2 nghĩa là có 5% ngẫu nhiên hay ít hơn rằng sự khác biệt này giữa 2 giá trị trung bình sẽ nảy sinh chỉ bởi ngẫu nhiên. Người ta thấy rằng tiến hành một test t trở nên khá khó khăn ngay cả với những mẫu tương đối nhỏ. Người ta phải sử dụng máy vi tính để làm, và những chỉ dẫn ở trên được bao gồm hơn để chứng minh làm thế nào nó thực sự đang được thực hiện. Tuy nhiên, có 2 điều hiển nhiên xảy ra . Giá trị t càng cao thì xác suất mà sự khác biệt quan sát được giữa giá trị trung bình của hai nhóm là một kết quả ngẫu nhiên càng nhỏ. Từ công thức cuối cùng có thể thấy rằng sự khác nhau giữa các trị trung bình càng lớn thì giá trị t sẽ càng cao.Thêm nữa, đo lường kết hợp sự lan tỏa xung quanh giá trị trung bình nhỏ hơn (Sp) thì giá trị t sẽ cao hơn. Một sự khác nhau nhỏ giữa 2 nhóm có thể khá ý nghĩa nếu độ lệch chuẩn là thấp, trái lại một sự khác nhau lớn giữa 2 nhóm với độ lệch chuẩn cao có thể chỉ là phát hiện ngẫu nhiên. Có một giới hạn khi sử dụng test t : nếu độ lệch chuẩn của 2 nhóm rất khác nhau (một là lớn hơn hai lần cái khác) thì test t phải không được thực hiện như đã mô tả ở trên . Tuy nhiên chương trình thống kê mà anh yêu thích có thể có 1 test giá trị đôi khi, hay tư vấn một nhà thống kê học, bởi vì sự lan tỏa rất khác nhau trong 2 nhóm có nghĩa là anh phải quan tâm hơn khi so sánh hai trị trung bình. Test Chi 2. Ở phần 2 của 2 ví dụ trên, chúng ta không có đo lường một số biến liên tục của 2 nhóm mà thay vì các thành viên của người thuộc các loại khác nhau . Điều này trở nên hơi lạ để nói về “ giới tính trung bình” trong một nhóm bệnh nhân. Tình huống cơ bản là bảng 2x2 quen thuộc, mà có thể đây là một ví dụ: Tiêm chủng Ốm Khoẻ Không tiêm chủng 10 80 90 40 20 60 50 100 150 Tuy nhiên bảng 2x2 dễ dàng mở rộng tới một bảng có nhiều cột hơn và hay nhiều hàng hơn nếu có nhiều loại phơi nhiễm hay kết quả hay cả hai. Trong tình huống này, các đối tượng chỉ có thể thuộc hai loại: tiêm chủng hay không tiêm chủng, và hoặc là hai loại ốm và khỏe. Cách này không có ý nghĩa khi cho một giá trị sức khỏe trung bình trong nhóm được tiêm chủng, hay một tình trạng tiêm chủng trung bình trong nhóm khỏe mạnh .Loại dữ liệu này như thế là khá khác với test t ở trên, và thường được gọi là biến phân hạng ngược với biến liên tục. Trong chương 4, chúng ta đã thấy cách tính một OR đối với 1 bảng như thế, và khoảng tin cậy với giá trị này. Nếu chúng ta muốn thực hiện một test có ý nghĩa thống kê thay vì, câu hỏi để hỏi là: loại xác suất gì mà 150 đối tượng nghiên cứu phân chia cách này thành ốm và khỏe mạnh chỉ bởi tính ngẫu nhiên?Một xác suất rất thấp của một sự ngẫu nhiên như thế sẽ làm gia tăng trọng lượng đến giả thiết của chúng ta là vaccin có hiệu quả. Cách giải thích như sau: có 50 người bị ốm và 100 người vẫn còn khỏe mạnh. Nếu vaccin là không có hiệu quả toàn bộ, chúng ta sẽ giả định rằng nó chẳng là vấn đề gì dù một đối tượng đã tiêm chủng hay không. Bởi vì 1/3 trong tổng số bị ốm, đây sẽ là tỷ lệ mong muốn trong mỗi nhóm cá thể. Trong nhóm 90 người được chủng vaccin, chúng ta mong muốn 30 người bị ốm, và trong nhóm không chủng vaccin sẽ là 60, 20. Bảng kỳ vọng 2x2 nếu vaccin không có tác dụng chút nào sẽ là Bảng kỳ vọng Ốm Khoẻ Tiêm chủng 30 60 90 không tiêm chủng 20 40 60 50 100 150 Cách chung để tính giá trị mong muốn cho một ô trong bảng 2x2 ( hay 3x3, hay 5x3…) là nhân tổng cột ở đáy của cột tương ứng với tổng số hàng ở bên phải, rồi chia số này với tổng ở góc bên phải thấp hơn. Đối với ô đầu tiên trong ví dụ sẽ là 90x50/150 =30,