Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018<br />
<br />
<br />
XÁC ĐỊNH CỠ MẪU TRONG NGHIÊN CỨU Y HỌC<br />
KHI KHÔNG CÓ CÔNG THỨC: PHƯƠNG PHÁP GIẢ LẬP<br />
Thái Thanh Trúc*, Bùi Thị Hy Hân**<br />
<br />
TÓM TẮT<br />
Mở đầu: Tính toán cỡ mẫu là một bước quan trọng trong xây dựng đề cương nghiên cứu khoa học. Từ<br />
nhu cầu ngày càng đa dạng các mục tiêu, cách triển khai nghiên cứu và sự thiếu hụt các công thức tính cỡ<br />
mẫu tương ứng thì việc tính toán cỡ mẫu dựa vào phương pháp giả lập trở nên hữu ích.<br />
Mục tiêu: Ứng dụng tính cỡ mẫu theo phương pháp giả lập và so sánh kết quả với các công thức hiện<br />
có.<br />
Đối tượng - Phương pháp nghiên cứu: Quy trình 5 bước để tính cỡ mẫu dựa vào giả lập số liệu được<br />
sử dụng với một số tình huống nghiên cứu, bao gồm so sánh hai trung bình, so sánh hai tỉ lệ và xây dựng<br />
mô hình hồi quy logistic. Tất cả thuật toán giả lập số liệu và phân tích thống kê được thực hiện bằng phần<br />
mềm Stata.<br />
Kết quả: Các lệnh Stata sử dụng để giả lập số liệu ngắn gọn. Kết quả tính cỡ mẫu chính xác và tương<br />
đồng so với công thức tính cỡ mẫu hiện có. Phương pháp này có thể áp dụng được để tính cỡ mẫu cho các<br />
trường hợp phức tạp như mô hình hồi quy logistic.<br />
Kết luận: Do không có đầy đủ công thức tính cỡ mẫu cho tất cả các tình huống nghiên cứu trong thực<br />
tế, việc tính cỡ mẫu dựa vào phương pháp giả lập số liệu cho thấy khả thi và chính xác. Tuy nhiên, việc triển<br />
khai phương pháp này đỏi hỏi kỹ thuật chuyên môn về toán thống kê, về lập trình cùng sự am hiểu phần<br />
mềm sử dụng tính cỡ mẫu mới đảm bảo được độ chính xác mong muốn.<br />
Từ khóa: cỡ mẫu, nghiên cứu y học, giả lập, công thức.<br />
ABSTRACT<br />
SAMPLE SIZE DETERMINATION IN MEDICAL RESEARCH WITHOUT FORMULA:<br />
SIMULATION APPROACH<br />
Thai Thanh Truc, Bui Thi Hy Han<br />
* Y Hoc TP. Ho Chi Minh * Supplement Vol. 22 - No 1- 2018: 347 - 353<br />
<br />
Introduction: Sample size determination is an important step in designing a research protocol. Due to<br />
the need for various types of research objective and design as well as the lack of corresponding sample size<br />
calculation formula, sample size calculation using simulation becomes an useful approach.<br />
Objectives: To apply sample size calculation by simulation and to compare the results with existing<br />
formulas.<br />
Methods: We employed 5 steps in calculating sample size by data simulation for some research<br />
scenarios, including sample size to compare two means, sample size to compare two proportions and logistic<br />
regression. All algorithm for data simulation and data analysis were conducted using Stata.<br />
Results: Stata commands used to simulate data were brief. The results were precise and similar to those<br />
obtained from existing formulas. This approach can be used to calculate sample size for complex situations<br />
such as logistic regression.<br />
<br />
* Khoa YTCC, ĐH Y Dược TPHCM, ** Viện Y Tế Công Cộng TPHCM<br />
Tác giả liên lạc: TS. Thái Thanh Trúc ĐT: 0908381266 Email: thaithanhtruc@ump.edu.vn<br />
348 Chuyên Đề Y tế Công cộng – Khoa học Cơ bản<br />
Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018 Nghiên cứu Y học<br />
<br />
Conclusion: Due to the lack of sample size formula for all research scenarios in the real life, calculating<br />
sample size using data simulation has been showed as a practical and precise approach. However, this<br />
approach requires advanced knowledge about statistics, programming and the software used to ensure the<br />
calculation precision.<br />
Keywords: sample size, medical research, simulation, formula.<br />
GIỚI THIỆU mềm thống kê để có được cỡ mẫu đảm bảo độ<br />
chính xác và sức mạnh thống kê phù hợp(2, 9).<br />
Tính toán cỡ mẫu là một bước quan trọng<br />
Từ nhu cầu ngày càng đa dạng các mục<br />
trong xây dựng đề cương nghiên cứu khoa<br />
tiêu, cách triển khai nghiên cứu thì việc tính<br />
học. Ứng với mỗi mục tiêu nghiên cứu đặt ra,<br />
toán cỡ mẫu dựa vào phương pháp giả lập số<br />
nhà nghiên cứu tìm kiếm công thức tính cỡ<br />
liệu này càng trở nên hữu ích(7). Bài báo của<br />
mẫu và các tham số từ y văn để tính ra cỡ mẫu<br />
chúng tôi nhằm giới thiệu nguyên tắc, phương<br />
dự trù cần có cho nghiên cứu của mình(5). Ví<br />
pháp triển khai của kỹ thuật tính toán cỡ mẫu<br />
dụ, với mục tiêu ước tính tỉ lệ hiện mắc tăng<br />
này trong nghiên cứu. Tuy nhiên, để cụ thể<br />
huyết áp trong cộng đồng, nhà nghiên cứu có<br />
hóa và giúp so sánh được với các phương<br />
thể sử dụng công thức tính cỡ mẫu để ước tính<br />
pháp tính cỡ mẫu truyền thống, tức là khi có<br />
một tỉ lệ hiện mắc. Sau đó, dựa vào tỉ lệ tăng<br />
công thức, phạm vi bài báo này dừng ở các<br />
huyết áp tìm được trên y văn và sai số của ước<br />
tình huống về tính cỡ mẫu khi so sánh hai<br />
lượng kèm mức độ tin cậy của ước lượng sẽ<br />
trung bình và khi so sánh hai tỉ lệ. Bài báo<br />
tính được cỡ mẫu tương ứng(5,8). Tuy nhiên,<br />
cũng áp dụng tính cỡ mẫu cho tình huống<br />
không phải lúc nào nhà nghiên cứu cũng có<br />
phức tạp hơn là hồi quy logistic.<br />
công thức tính cỡ mẫu cho mục tiêu nghiên<br />
của mình, đặc biệt là các trường hợp nghiên PHƯƠNG PHÁP<br />
cứu phức tạp. Sức mạnh thống kê<br />
Khi không có công thức tính cỡ mẫu, nhiều Về mặt toán thống kê, sức mạnh thống kê,<br />
nhà nghiên cứu thường hay chọn cỡ mẫu dựa còn gọi là lực mẫu, được hiểu là xác suất bác<br />
theo kinh nghiệm hoặc các quy tắc lòng bàn bỏ H0 khi H0 sai(8). Về mặt nghiên cứu có thể<br />
tay mặc dù điều này có thể không hoàn toàn hiểu đơn giản hơn sức mạnh thống kê là xác<br />
chính xác(3, 8). Ví dụ, một số ít nhà nghiên cứu suất nghiên cứu kết luận có liên quan có ý<br />
cho rằng cỡ mẫu 30 đối tượng là đủ cho các nghĩa thống kê khi thật sự có liên quan vốn đã<br />
nghiên cứu lâm sàng. Mặc dù điều này giúp được báo cáo trên y văn. Ví dụ, sức mạnh<br />
tăng tính khả thi của nghiên cứu, nhưng độ thống kê bằng 80% có nghĩa là nếu tiến hành<br />
chính xác trong các tính toán hoặc phân tích 100 nghiên cứu thì sẽ có khoảng 80 nghiên cứu<br />
kiểm định thống kê khi đã thu thập xong dữ cho kết luận có liên quan. Ở đây, thông<br />
liệu lại không cao. Một khi cỡ mẫu không đủ thường ‘có liên quan’ được quy ước là khi giá<br />
chính xác, các phép kiểm định không đủ sức trị p của nghiên cứu nhỏ hơn 0,05. Cho nên,<br />
mạnh thống kê thì nghiên cứu có thể không có sức mạnh thống kê 80% cũng có nghĩa là có 80<br />
giá trị và không thể ứng dụng trong thực tế. nghiên cứu cho kết quả giá trị p < 0,05 khi tiến<br />
Một trong các cách tiếp cận tính cỡ mẫu trong hành phân tích trên 100 mẫu nghiên cứu. Nếu<br />
trường hợp không có công thức là dựa vào giả khi phân tích trên 100 mẫu nghiên cứu mà có<br />
lập ngẫu nhiên dữ liệu ứng với thông tin của 60 nghiên cứu cho p < 0,05 thì sức mạnh thống<br />
các đặc điểm trong nghiên cứu và các kiểm kê tương ứng là 60%. Đây chính là cơ sở cho<br />
định, mô hình vốn có sẵn trên hầu hết phần các phương pháp giả lập số liệu để từ đó xác<br />
định cỡ mẫu phù hợp. Nguyên tắc triển khai<br />
<br />
<br />
Y tế Công cộng 349<br />
Nghiên cứu Y học Y Học TP. Hồ Chí Minh * Phụ Bản Tập 22 * Số 1 * 2018<br />
<br />
của phương pháp này là giả lập số liệu nhiều Bước 3: Thực hiện lại bước 1 và 2 nhiều lần<br />
lần và đếm tỉ lệ số lần có p