YOMEDIA

ADSENSE
Thực hành phân tích gộp sử dụng STATA
2
lượt xem 1
download
lượt xem 1
download

Phân tích gộp đóng vai trò quan trọng trong y học thực chứng, cho phép tổng hợp kết quả từ nhiều nghiên cứu để đưa ra bằng chứng y học có độ tin cậy cao. Bài viết mô tả cách tiến hành phân tích gộp sử dụng phần mềm STATA.
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Thực hành phân tích gộp sử dụng STATA
- Nghiên cứu Y học Tạp chí Y học Thành phố Hồ Chí Minh; 28(2):141-153 ISSN: 1859-1779 https://doi.org/10.32895/hcjm.m.2025.02.18 Thực hành phân tích gộp sử dụng STATA Hoàng Tùng1,*, Trương Mai Vân1, Nguyễn Thị Huyền Trâm1, Trần Tiểu Trang1 Trường Đại học Khoa học Sức khỏe, Đại học Quốc gia Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam 1 Tóm tắt Đặt vấn đề: Phân tích gộp đóng vai trò quan trọng trong y học thực chứng, cho phép tổng hợp kết quả từ nhiều nghiên cứu để đưa ra bằng chứng y học có độ tin cậy cao. Mục tiêu: Trong nghiên cứu này, chúng tôi mô tả cách tiến hành phân tích gộp sử dụng phần mềm STATA. Đối tượng và phương pháp nghiên cứu: Cách tiến hành được mô tả cho các trường hợp dữ liệu đầu vào bao gồm các biến số cho từng nhóm nghiên cứu hoặc các giá trị mức độ ảnh hưởng so sánh giữa hai nhóm, khi kết quả đầu ra là biến nhị phân hoặc biến liên tục. Đối với mỗi trường hợp, chúng tôi nêu các biến số cần thu thập từ các nghiên cứu, bố trí dữ liệu, tính toán mức độ ảnh hưởng gộp thông qua mô hình tác động cố định và tác động ngẫu nhiên, tính toán tính bất đồng nhất giữa các nghiên cứu sử dụng chỉ số I2, và hiển thị các kết quả đó trong biểu đồ rừng. Tiếp đó, tiến hành đánh giá sai lệch xuất bản của vấn đề nghiên cứu sử dụng kiểm định Egger và kiểm định Begg. Kết luận: Thông qua các ví dụ thực tế, hi vọng tài liệu sẽ hữu ích cho các bác sĩ, dược sĩ, và nghiên cứu viên, đồng thời khuyến khích việc áp dụng phân tích gộp trong các nghiên cứu y học trong tương lai. Từ khóa: phân tích gộp; thực hành; phần mềm STATA Abstract A STEP-BY-STEP META-ANALYSIS TUTORIAL USING STATA Hoang Tung, Truong Mai Van, Nguyen Thi Huyen Tram, Tran Tieu Trang Background: Meta-analysis is an essential statistical method in evidence-based medicine, allowing researchers to synthesize findings from multiple studies to generate more comprehensive and robust conclusions. Objectives: This tutorial provides a thorough introduction to meta-analysis, with a focus on conducting analyses using STATA software, aimed at healthcare professionals, researchers, and anyone interested in medical research. Method: We offered a detailed, step-by-step guide to conducting meta-analyses, especially for studies reporting binary or continuous outcomes. Specifically, we covered data management for both arm-based and contrast-based data formats, which allowed flexibility in working with various types of study designs. The tutorial guided users through inputting study data, calculating pooled effect sizes using both fixed-effects and random-effects models, and assessing Ngày nhận bài: 21-02-2025 / Ngày chấp nhận đăng bài: 10-03-2025 / Ngày đăng bài: 12-03-2025 *Tác giả liên hệ: Hoàng Tùng. Trường Đại học Khoa học Sức khỏe, Đại học Quốc gia Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh, Việt Nam. E-mail: htung@uhsvnu.edu.vn © 2025 Bản quyền thuộc về Tạp chí Y học Thành phố Hồ Chí Minh. https://www.tapchiyhoctphcm.vn 141
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 study heterogeneity through the I² statistic, which helped to determine the consistency of results across studies. We also demonstrated how to generate forest plots to visually present meta-analytic findings, offering a clear view of each study's contribution to the pooled estimate. Additionally, to address publication bias, we included instructions on performing Egger's and Begg's tests, providing users with methods to evaluate the potential influence of unpublished studies on their results. Conclusion: By using practical examples and step-by-step coding instructions, this tutorial aimed to equip users with the skills needed to perform high-quality meta-analyses in STATA. Ultimately, this resource supports users in generating reliable research findings that contribute to evidence-based medical practice. Keywords: meta-analysis; tutorial; STATA 1. ĐẶT VẤN ĐỀ 2.1. Đối tượng nghiên cứu Các dữ liệu đầu vào bao gồm các biến số cho từng nhóm Thuật ngữ “Y học dựa trên bằng chứng” được cho là bắt nghiên cứu hoặc các giá trị mức độ ảnh hưởng so sánh giữa nguồn từ giữa thế kỷ 19, nhấn mạnh tầm quan trọng của việc hai nhóm, lấy từ các công bố tổng quan hệ thống trước đây. sử dụng các bằng chứng khoa học đáng tin cậy để đưa ra Nghiên cứu được thực hiện tại Trường Đại học Khoa học Sức quyết định lâm sàng [1]. Trong tháp bằng chứng y học, tổng khỏe - Đại học Quốc gia Thành phố Hồ Chí Minh từ tháng quan hệ thống và phân tích gộp đứng ở mức cao nhất về độ 9/2024 đến tháng 12/2024. tin cậy, vì chúng kết hợp dữ liệu từ nhiều nghiên cứu độc lập, giúp tăng cường độ chính xác và khả năng tổng quát hóa kết 2.2. Phương pháp nghiên cứu quả [1]. 2.2.1. Quy trình thực hiện Phân tích gộp có vai trò quan trọng trong việc làm rõ những điểm còn tranh cãi hoặc chưa chắc chắn từ các nghiên cứu đơn lẻ, cung cấp một bức tranh toàn diện hơn về hiệu quả của các phương pháp điều trị hoặc các yếu tố nguy cơ [2]. Nhờ sự kết hợp của các kết quả từ nhiều nghiên cứu, phân tích gộp giúp tăng độ mạnh thống kê, giảm nguy cơ sai lệch và đưa ra kết luận chính xác hơn [2]. Kết quả từ phân tích gộp cung cấp bằng chứng quan trọng, có giá trị cao trong việc hỗ trợ đưa ra quyết định lâm sàng, xây dựng hướng dẫn điều trị, và phát triển chính sách y tế. Trong các phần mềm thống kê có thể thực hiện phân tích gộp, STATA (https://www.stata.com) tuy là một phần mềm trả phí nhưng lại thuận tiện khi làm việc với dữ liệu, có cấu trúc câu lệnh đơn giản và nhiều tính năng hiển thị kết quả. Chính vì thế, trong bài nghiên cứu này, chúng tôi cung cấp Hình 1. Sơ đồ các bước tiến hành phân tích gộp cho các bác sĩ, dược sĩ và nhà nghiên cứu hướng dẫn chi tiết Đầu tiên, dữ liệu từ các nghiên cứu gốc được thu thập và về cách thực hiện phân tích gộp bằng phần mềm STATA và mã hóa theo từng trường hợp cụ thể. Dữ liệu được phân loại biện giải kết quả, nhằm hỗ trợ quá trình tự tiến hành phân tích thành hai dạng chính tùy thuộc vào kết quả đầu ra: biến nhị và áp dụng vào công việc chuyên môn. phân (ví dụ: tình trạng mắc bệnh hoặc không mắc bệnh, điều trị khỏi bệnh hoặc không khỏi bệnh) hoặc biến liên tục (ví dụ: 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP huyết áp, lượng đường huyết, mỡ máu). Ở mỗi trường hợp, NGHIÊN CỨU dữ liệu cũng được bố trí khi nghiên cứu gốc cung cấp số 142 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.02.18
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 lượng đối tượng ở từng nhóm nghiên cứu (arm-based data) rừng (forest plot). Cuối cùng, mức độ bất đồng nhất sẽ được hoặc mức độ ảnh hưởng (effect size) giữa hai nhóm nghiên báo cáo thông qua chỉ số Cochrane I2 (3) và sai lệch xuất bản cứu (contrast-based data) (Hình 1). sẽ được đánh giá bằng kiểm định Egger (4) và kiểm định Begg (5). Tiếp theo, tùy thuộc và mức độ bất đồng nhất của kết quả từ các nghiên cứu gốc, mô hình tác động cố định (fixed- 2.2.4. Xử lý số liệu effects model) hoặc mô hình tác động ngẫu nhiên (random Trong nghiên cứu, chúng tôi sử dụng dữ liệu từ hai tổng effect model) sẽ được sử dụng để tính toán mức độ ảnh hưởng quan hệ thống và phân tích gộp trước đây làm ví dụ để mô tả gộp của yếu tố nguy cơ hoặc liệu pháp can thiệp. Mức độ ảnh quy trình tiến hành và cách chạy câu lệnh trong STATA (Hình hưởng trong trường hợp kết quả đầu ra là biến nhị phân bao 2A-2D) [6,7]. Hai bài báo được xuất bản trên các tạp chí truy gồm tỷ số chênh (odds ratio), nguy cơ tương đối (relative risk, cập mở (Open Access) theo giấy phép CC BY 4.0 và do đó NCTĐ), và tỷ lệ rủi ro (hazard ratio). Đối với kết quả đầu ra được miễn phê duyệt đạo đức và có thể sử dụng [6,7]. Các dữ là biến liên tục, mức độ ảnh hưởng bao gồm khác biệt trung liệu này được tổng hợp thành bảng trong phần mềm Excel, bình (mean difference, KBTB) và khác biệt trung bình chuẩn sau đó được sao chép và dán vào ô “Data Editor” trong phần hóa (standardized mean difference). Mức độ ảnh hưởng gộp mềm STATA. cũng như mức độ ảnh hưởng của các nghiên cứu thành phần Để thực hiện các câu lệnh trong phân tích gộp, gói bổ trợ và khoảng tin cậy (KTC) 95% được thể hiện trong biểu đồ “metan” được cài đặt theo câu lệnh: ssc install metan. Hình 2. Mẫu dữ liệu sử dụng cho phân tích gộp trong trường hợp. (A) dữ liệu đầu vào cho từng nhóm nghiên cứu, kết quả đầu ra là biến nhị phân; (B) dữ liệu đầu vào so sánh hai nhóm nghiên cứu, kết quả đầu ra là biến nhị phân; (C) dữ liệu đầu vào cho từng nhóm nghiên cứu, kết quả đầu ra là biến liên tục; (D) dữ liệu đầu vào so sánh hai nhóm nghiên cứu, kết quả đầu ra là biến liên tục 3. KẾT QUẢ ra là biến nhị phân, chúng tôi sử dụng dữ liệu mẫu về hiệu quả của việc sử dụng aspirin trong dự phòng biến cố tim mạch. Trong trường hợp này, kết quả đầu ra là tình trạng tử 3.1. Phân tích gộp cho kết quả đầu ra là biến nhị phân vong hoặc không tử vong do bệnh tim mạch [6]. 3.1.1. Dữ liệu phân tích là số lượng đối tượng ở từng nhóm nghiên cứu Cấu trúc dữ liệu đầu vào Khi các nghiên cứu gốc cung cấp số lượng đối tượng ở mỗi Phân tích gộp sử dụng dữ liệu từ 13 nghiên cứu, bao gồm nhóm nghiên cứu, để tiến hành phân tích gộp với kết quả đầu số lượng người tham gia nghiên cứu trong nhóm sử dụng https://doi.org/10.32895/hcjm.m.2025.02.18 https://www.tapchiyhoctphcm.vn | 143
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 aspirin (biến i) và nhóm không sử dụng aspirin (biến p), cũng Do vậy, việc sử dụng aspirin có liên quan đến giảm 10% nguy như số lượng cá thể tử vong do biến cố tim mạch ở mỗi nhóm cơ tử vong do biến cố tim mạch, và mối liên quan này có ý (biến ci và cp) (Hình 2A). Sau đó, số lượng cá thể không tử nghĩa thống kê. vong do biến cố tim mạch ở mỗi nhóm (biến ni và np) được Bên cạnh đó, tính bất đồng nhất về khác biệt giữa kết quả tính thông qua hàm generate với câu lệnh: các nghiên cứu thành phần được thể hiện qua chỉ số I2. Với • generate ni=i-ci kết quả 0%, các nghiên cứu thành phần không có sự dị biệt. • generate np=p-cp Các kết quả về mức độ ảnh hưởng và tính bất đồng nhất cũng được thể hiện trong biểu đồ rừng (Hình 3). Biểu đồ rừng Sai lệch xuất bản NCTĐ gộp và KTC 95% cho mối liên hệ giữa sử dụng aspirin và tử vong do biến cố tim mạch được tính thông qua Để đánh giá sai lệch xuất bản, trước tiên logarit tự nhiên hàm metan dựa trên mô hình tác động cố định và mô hình tác của NCTĐ (biến logrr) và sai số chuẩn (biến selogrr) cho từng động ngẫu nhiên lần lượt theo hai câu lệnh: nghiên cứu thành phần được tính thông qua hàm generate, phép toán log, và phép toán sqrt theo câu lệnh sau: • metan ci ni cp np, xlab(0.1, 1, 2) label(namevar=study) fixed • generate logrr=log((ci/i)/(cp/p)) • metan ci ni cp np, xlab(0.1, 1, 2) label(namevar=study) random • generate selogrr=sqrt((1/ci)-(1/i)+(1/cp)-(1/p)) Trong đó, tùy chọn xlab xác định cụ thể các giá trị được Sau đó, kiểm định Egger và kiểm định Begg cho sai lệch hiển thị trên biểu đồ rừng của kết quả, tùy chọn label dùng để xuất bản được tiến hành sử dụng hàm metabias theo câu lệnh: chỉ định tên cụ thể của từng nghiên cứu được lấy từ biến • metabias logrr selogrr, egger study, tùy chọn fixed được sử dụng khi tính toán theo mô hình tác động cố định, và random khi tính toán theo mô hình tác • metabias logrr selogrr, begg động ngẫu nhiên. Kết quả giá trị p=0,49 trong kiểm định Egger và p=0,67 trong kiểm định Begg (p >0,05) cho thấy không có sai lệch Theo đó, phần mềm STATA cho ra cùng kết quả ước tính xuất bản trong các nghiên cứu đánh giá hiệu quả của việc sử NCTĐ=0,90 (KTC 95% 0,86-0,94) cho mô hình tác động cố dụng aspirin trong dự phòng biến cố tim mạch (Hình 4). định (Bảng 1A) và mô hình tác động ngẫu nhiên (Bảng 1B). Bảng 1. Kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên với dữ liệu đầu vào cho từng nhóm nghiên cứu và kết quả đầu ra là biến nhị phân (A) (B) Study | RR [95% Conf. Interval] % Weight Study | RR [95% Conf. Interval] % Weight ---------------- +---------------------------------------- ------------------ +------------------------------------------ HOT | 0.858 0.743 0.992 11.31 HOT | 0.858 0.743 0.992 10.85 TPT | 0.763 0.599 0.972 4.07 TPT | 0.763 0.599 0.972 3.88 PPP | 0.717 0.492 1.045 1.87 PPP | 0.717 0.492 1.045 1.60 WHS | 0.914 0.809 1.033 15.41 WHS | 0.914 0.809 1.033 15.08 BDS | 1.015 0.838 1.229 5.63 BDS | 1.015 0.838 1.229 6.17 PHS | 0.830 0.715 0.963 10.93 PHS | 0.830 0.715 0.963 10.21 AAA | 0.985 0.784 1.239 4.02 AAA | 0.985 0.784 1.239 4.33 POPADAD | 0.962 0.774 1.196 3.90 POPADAD | 0.962 0.774 1.196 4.79 JPAD | 0.810 0.575 1.140 2.05 JPAD | 0.810 0.575 1.140 1.93 JPPP | 0.935 0.771 1.135 6.10 JPPP | 0.935 0.771 1.135 6.06 ASCEND | 0.923 0.825 1.033 17.33 ASCEND | 0.923 0.825 1.033 17.93 ARRIVE | 0.955 0.792 1.151 6.43 ARRIVE | 0.955 0.792 1.151 6.50 ASPREE | 0.890 0.770 1.030 10.95 ASPREE | 0.890 0.770 1.030 10.69 ------------------ +--------------------------------------- ------------------ +--------------------------------------- M-H pooled RR | 0.900 0.858 0.944 100.00 D+L pooled RR | 0.901 0.859 0.945 100.00 ----------------- +--------------------------------------- ------------------ +--------------------------------------- Heterogeneity chi-squared = 8.42 (d.f. = 12) p = 0.751 Heterogeneity chi-squared = 8.42 (d.f. = 12) p = 0.751 I-squared (variation in RR attributable to heterogeneity) = I-squared (variation in RR attributable to heterogeneity) = 0.0% 0.0% Estimate of between-study variance Tau-squared = 0.0000 Test of RR=1 : z= 4.34 p = 0.000 Test of RR=1 : z= 4.30 p = 0.000 144 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.02.18
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 Hình 3. Biểu đồ rừng kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên về hiệu quả của việc sử dụng aspirin trong dự phòng biến cố tim mạch Hình 4. Kết quả kiểm định Egger và kiểm định Begg đánh giá sai lệch xuất bản các nghiên cứu về hiệu quả của việc sử dụng aspirin trong dự phòng biến cố tim mạch https://doi.org/10.32895/hcjm.m.2025.02.18 https://www.tapchiyhoctphcm.vn | 145
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 3.1.2. Dữ liệu phân tích là mức độ ảnh hưởng giữa nhiên lần lượt theo hai câu lệnh: hai nhóm nghiên cứu • metan logrr logll logul, eform xlab(0.2, 0.5, 1, 2, 5) Khi các nghiên cứu gốc cung cấp dữ liệu về mức độ ảnh label(namevar=study) fixed hưởng giữa hai nhóm nghiên cứu, để tiến hành phân tích gộp với kết quả đầu ra là biến nhị phân, chúng tôi sử dụng dữ liệu • metan logrr logll logul, eform xlab(0.2, 0.5, 1, 2, 5) mẫu về mối liên quan giữa việc sử dụng aspirin với nguy cơ label(namevar=study) random xuất huyết. Trong trường hợp này, kết quả đầu ra là tình trạng Trong đó, tùy chọn eform nhằm thể hiện kết quả gộp được xuất huyết hoặc không xuất huyết [6]. tính toán với hàm mũ (NCTĐ và KTC 95%), tùy chọn xlab Cấu trúc dữ liệu đầu vào xác định cụ thể các giá trị được hiển thị trên biểu đồ rừng của kết quả, tùy chọn label dùng để chỉ định tên cụ thể của từng Phân tích gộp sử dụng dữ liệu từ 11 nghiên cứu, bao gồm nghiên cứu được lấy từ biến study, tùy chọn fixed được sử NCTĐ (biến rr) và KTC 95% (biến ll cho giới hạn dưới và dụng khi tính toán theo mô hình tác động cố định, và random biến ul cho giới hạn trên) cho mối liên quan giữa việc sử dụng khi tính toán theo mô hình tác động ngẫu nhiên. aspirin và nguy cơ xuất huyết (Hình 2B). Sau đó, logarit của giá trị NCTĐ và KTC 95% (biến logrr, biến logll, và biến Theo đó, phần mềm STATA cho ra cùng kết quả ước tính logul) được tính thông qua hàm generate và phép toán log NCTĐ=1,42 (KTC 95% 1,30-1,55) cho mô hình tác động cố theo câu lệnh: định (Bảng 2A) và mô hình tác động ngẫu nhiên (Bảng 2B). Do vậy, việc sử dụng aspirin có liên quan đến tăng 42% nguy • generate logrr=log(rr) cơ xuất huyết, và mối liên quan này có ý nghĩa thống kê. • generate logll=log(ll) Bên cạnh đó, tính bất đồng nhất về khác biệt giữa kết quả • generate logul=log(ul) các nghiên cứu thành phần được thể hiện qua chỉ số I2. Với Biểu đồ rừng kết quả 0%, các nghiên cứu thành phần không có sự dị biệt. Các kết quả về mức độ ảnh hưởng và tính bất đồng nhất cũng NCTĐ gộp và KTC 95% cho mối liên hệ giữa sử dụng được thể hiện trong biểu đồ rừng (Hình 5). aspirin và nguy cơ xuất huyết được tính thông qua hàm metan dựa trên mô hình tác động cố định và mô hình tác động ngẫu Bảng 2. Kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên với dữ liệu đầu vào so sánh hai nhóm nghiên cứu và kết quả đầu ra là biến nhị phân (A) (B) Study | ES [95% Conf. Interval] % Weight Study | ES [95% Conf. Interval] % Weight ---------------- +------------------------------------------ ------------------- +------------------------------------------ HOT | 1.740 1.320 2.300 9.94 HOT | 1.740 1.320 2.300 9.94 TPT | 2.010 0.610 6.650 0.54 TPT | 2.010 0.610 6.650 0.54 PPP | 2.830 1.320 6.050 1.32 PPP | 2.830 1.320 6.050 1.32 WHS | 1.400 1.070 1.830 10.64 WHS | 1.400 1.070 1.830 10.64 BDS | 1.000 0.470 2.130 1.34 BDS | 1.000 0.470 2.130 1.34 PHS | 1.600 1.010 2.520 3.67 PHS | 1.600 1.010 2.520 3.67 AAA | 1.700 0.980 2.940 2.54 AAA | 1.700 0.980 2.940 2.54 JPAD | 1.520 0.730 3.140 1.44 JPAD | 1.520 0.730 3.140 1.44 JPPP | 1.490 1.100 2.010 8.43 JPPP | 1.490 1.100 2.010 8.43 ASCEND | 1.280 1.090 1.510 28.85 ASCEND | 1.280 1.090 1.510 28.85 ASPREE | 1.370 1.170 1.600 31.28 ASPREE | 1.370 1.170 1.600 31.28 ---------------- +--------------------------------------- ------------------ +--------------------------------------- I-V pooled ES | 1.417 1.298 1.546 100.00 D+L pooled ES | 1.417 1.298 1.546 100.00 ---------------- +--------------------------------------- ------------------- +--------------------------------------- Heterogeneity calculated by formula Heterogeneity calculated by formula Q = SIGMA_i{ (1/variance_i)*(effect_i - effect_pooled)^2 } Q = SIGMA_i{ (1/variance_i)*(effect_i - effect_pooled)^2 } where variance_i = ((upper limit - lower limit)/(2*z))^2 where variance_i = ((upper limit - lower limit)/(2*z))^2 Heterogeneity chi-squared = 8.94 (d.f. = 10) p = 0.538 Heterogeneity chi-squared = 8.94 (d.f. = 10) p = 0.538 I-squared (variation in ES attributable to heterogeneity) = I-squared (variation in ES attributable to heterogeneity) = 0.0% 0.0% Estimate of between-study variance Tau-squared = 0.0000 Test of ES=1 : z= 7.80 p = 0.000 Test of ES=1 : z= 7.80 p = 0.000 146 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.02.18
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 Hình 5. Biểu đồ rừng kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên về mối liên quan giữa việc sử dụng aspirin với nguy cơ xuất huyết Hình 6. Kết quả kiểm định Egger và kiểm định Begg đánh giá sai lệch xuất bản các nghiên cứu về mối liên quan giữa việc sử dụng aspirin với nguy cơ xuất huyết https://doi.org/10.32895/hcjm.m.2025.02.18 https://www.tapchiyhoctphcm.vn | 147
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 Sai lệch xuất bản liều cao (biến nb) và nhóm sử dụng statin liều thấp phối hợp ezetimibe (biến np), cũng như nồng độ cholesterol trung bình Để đánh giá sai lệch xuất bản, trước tiên sai số chuẩn (biến (biến mb và mp) và độ lệch chuẩn (biến sdb và sdp) ở mỗi selogrr) cho từng nghiên cứu thành phần được tính thông qua nhóm (Hình 2C). hàm generate và phép toán log theo câu lệnh sau: Biểu đồ rừng generate selogrr = (logul-logll)/(2*1.96) KBTB gộp và KTC 95% cho hiệu quả giảm cholesterol của Sau đó, kiểm định Egger và kiểm định Begg cho sai lệch việc sử dụng statin liều cao so với statin liều thấp phối hợp xuất bản được tiến hành sử dụng hàm metabias theo câu lệnh: ezetimibe được tính thông qua hàm metan dựa trên mô hình metabias logrr selogrr, egger tác động cố định và mô hình tác động ngẫu nhiên lần lượt theo metabias logrr selogrr, begg hai câu lệnh: Kết quả giá trị p=0,09 trong kiểm định Egger và p=0,16 • metan nb mb sdb np mp sdp, nostandard xlab(-30, -20, - trong kiểm định Begg (p >0,05) cho thấy không có sai lệch 10, 0, 10, 20, 30) label (namevar=study) fixed xuất bản trong các nghiên cứu đánh giá mối liên quan giữa việc sử dụng aspirin với nguy cơ xuất huyết (Hình 6). • metan nb mb sdb np mp sdp, nostandard xlab(-30, -20, -10, 0, 10, 20, 30) label (namevar=study) random 3.2. Phân tích gộp cho kết quả đầu ra là biến Trong đó, tùy chọn nostandard được sử dụng để tính KBTB liên tục không chuẩn hóa, tùy chọn xlab xác định cụ thể các giá trị 3.2.1. Dữ liệu phân tích là giá trị trung bình ở từng được hiển thị trên biểu đồ rừng của kết quả, tùy chọn label nhóm nghiên cứu dùng để chỉ định tên cụ thể của từng nghiên cứu được lấy từ Khi các nghiên cứu gốc cung cấp dữ liệu về giá trị trung biến study, tùy chọn fixed được sử dụng khi tính toán theo mô bình ở mỗi nhóm nghiên cứu, để tiến hành phân tích gộp với hình tác động cố định, và random khi tính toán theo mô hình kết quả đầu ra là biến liên tục, chúng tôi sử dụng dữ liệu mẫu tác động ngẫu nhiên. về hiệu quả giảm cholesterol của việc sử dụng statin liều cao Theo đó, phần mềm STATA cho ra kết quả ước tính so với statin liều thấp phối hợp ezetimibe trên bệnh nhân tim KBTB=-10,85 mg/dL (KTC 95% -12,71 tới -9.00) cho mô mạch xơ vữa. Trong trường hợp này, kết quả đầu ra là khác hình tác động cố định (Bảng 3A) và NCTĐ=-8,98 mg/dL biệt trung bình cholesterol giữa hai nhóm sử dụng thuốc [7]. (KTC 95% -14,26 tới -3,70) cho mô hình tác động ngẫu nhiên Cấu trúc dữ liệu đầu vào (Bảng 3B). Do vậy, sử dụng statin liều cao giảm được lượng Phân tích gộp sử dụng dữ liệu từ 7 nghiên cứu, bao gồm số cholesterol nhiều hơn sử dụng statin liều thấp phối hợp lượng người tham gia nghiên cứu trong nhóm sử dụng statin ezetimibe 8,98 mg/dL, và khác biệt này có ý nghĩa thống kê. Bảng 3. Kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên với dữ liệu đầu vào cho từng nhóm nghiên cứu và kết quả đầu ra là biến liên tục (A) (B) Study | WMD [95% Conf. Interval] %Weight Study | WMD [95% Conf. Interval] % Weight ------------------ +---------------------------------------- ------------------ +----------------------------------------- Fichtlscherer, 2005 | 31.000 -9.790 71.790 0.21 Fichtlscherer, 2005 | 31.000 -9.790 71.790 1.60 Hong, 2023 |-10.300 -15.308 -5.292 13.73 Hong, 2023 |-10.300 -15.308 -5.292 26.12 Kim, 2022 |-11.200 -13.304 -9.096 77.77 Kim, 2022 | -11.200 -13.304 -9.096 32.38 Oh, 2020 | 3.600 -8.509 15.709 2.35 Oh, 2020 | 3.600 -8.509 15.709 12.22 Oh, 2021 | -2.400 -17.881 13.081 1.44 Oh, 2021 | -2.400 -17.881 13.081 8.68 Pytel, 2016 | 0.000 -38.221 38.221 0.24 Pytel, 2016 | 0.000 -38.221 38.221 1.81 Wu, 2018 |-19.720 -28.691 -10.749 4.28 Wu, 2018 | -19.720 -28.691 -10.749 17.20 ------------------- +---------------------------------------- ------------------- +----------------------------------------- I-V pooled WMD |-10.853 -12.709 -8.998 100.00 D+L pooled WMD | -8.981 -14.263 -3.699 100.00 ------------------ ---------------------+------------------ ------------------ +----------------------------------------- Heterogeneity chi-squared = 14.88 (d.f. = 6) p = 0.021 Heterogeneity chi-squared = 14.88 (d.f. = 6) p = 0.021 I-squared (variation in WMD attributable to heterogeneity) I-squared (variation in WMD attributable to heterogeneity) = 59.7% = 59.7% Estimate of between-study variance Tau-squared = 21.2813 Test of WMD=0 : z= 11.46 p = 0.000 Test of WMD=0 : z= 3.33 p = 0.001 148 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.02.18
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 Hình 7. Biểu đồ rừng kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên về hiệu quả giảm cholesterol của việc sử dụng statin liều cao so với statin liều thấp phối hợp ezetimibe trên bệnh nhân tim mạch xơ vữa Hình 8. Kết quả kiểm định Egger và kiểm định Begg đánh giá sai lệch xuất bản các nghiên cứu về hiệu quả giảm cholesterol của việc sử dụng statin liều cao so với statin liều thấp phối hợp ezetimibe trên bệnh nhân tim mạch xơ vữa https://doi.org/10.32895/hcjm.m.2025.02.18 https://www.tapchiyhoctphcm.vn | 149
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 Bên cạnh đó, tính bất đồng nhất về khác biệt giữa kết quả Cấu trúc dữ liệu đầu vào các nghiên cứu thành phần được thể hiện qua chỉ số I2. Với Phân tích gộp sử dụng dữ liệu từ 6 nghiên cứu, bao gồm kết quả 59,7%, các nghiên cứu thành phần có sự khác biệt KBTB (biến md) và KTC 95% (biến ll cho giới hạn dưới và đáng kể về kết quả. Các kết quả về mức độ ảnh hưởng và tính biến ul cho giới hạn trên) cho hiệu quả giảm triglyceride của bất đồng nhất cũng được thể hiện trong biểu đồ rừng (Hình 7). việc sử dụng statin liều cao so với statin liều thấp phối hợp Sai lệch xuất bản ezetimibe trên bệnh nhân tim mạch xơ vữa (Hình 2D). Để đánh giá sai lệch xuất bản, kiểm định Egger và kiểm Biểu đồ rừng định Begg cho sai lệch xuất bản được tiến hành sử dụng hàm KBTB gộp và KTC 95% cho hiệu quả giảm triglyceride metabias theo câu lệnh: của việc sử dụng statin liều cao so với statin liều thấp phối • metabias _ES _seES, egger hợp ezetimibe được tính thông qua hàm metan dựa trên mô • metabias _ES _seES, begg hình tác động cố định và mô hình tác động ngẫu nhiên lần lượt theo hai câu lệnh: Trong đó, biến _ES và _seES là mức độ ảnh hưởng cho KBTB giữa hai nhóm và sai số chuẩn tương ứng, được tính • metan md ll ul, xlab(-30, -20, -10, 0, 10, 20, 30) tự động trong quá trình sử dụng hàm metan ở trên. Kết quả label(namevar=study) fixed giá trị p=0,22 trong kiểm định Egger và p=0,23 trong kiểm • metan md ll ul, xlab(-30, -20, -10, 0, 10, 20, 30) định Begg (p >0,05) cho thấy không có sai lệch xuất bản trong label(namevar=study) random các nghiên cứu đánh giá hiệu quả giảm cholesterol của việc Trong đó, tùy chọn xlab xác định cụ thể các giá trị được sử dụng statin liều cao so với statin liều thấp phối hợp hiển thị trên biểu đồ rừng của kết quả, tùy chọn label dùng để ezetimibe trên bệnh nhân tim mạch xơ vữa (Hình 8). chỉ định tên cụ thể của từng nghiên cứu được lấy từ biến 3.2.2. Dữ liệu phân tích là mức độ ảnh hưởng giữa study, tùy chọn fixed được sử dụng khi tính toán theo mô hình hai nhóm nghiên cứu tác động cố định, và random khi tính toán theo mô hình tác động ngẫu nhiên. Khi các nghiên cứu gốc cung cấp dữ liệu về khác biệt trung bình giữa hai nhóm nghiên cứu, để tiến hành phân tích gộp với Theo đó, phần mềm STATA cho ra kết quả ước tính kết quả đầu ra là biến liên tục, chúng tôi sử dụng dữ liệu mẫu KBTB=-8,20 mg/dL (KTC 95% -13,05 tới -3,35) cho mô về hiệu quả giảm triglyceride của việc sử dụng statin liều cao hình tác động cố định (Bảng 4A) và NCTĐ=-8,08 mg/dL so với statin liều thấp phối hợp ezetimibe trên bệnh nhân tim (KTC 95% -13,18 tới -2,97) cho mô hình tác động ngẫu nhiên (Bảng 4B). Do vậy, sử dụng statin liều cao giảm được lượng mạch xơ vữa. Trong trường hợp này, kết quả đầu ra là khác biệt triglyceride nhiều hơn sử dụng statin liều thấp phối hợp trung bình cholesterol giữa hai nhóm sử dụng thuốc [7]. ezetimibe 8,08 mg/dL, và khác biệt này có ý nghĩa thống kê. Bảng 4. Kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên với dữ liệu đầu vào so sánh hai nhóm nghiên cứu và kết quả đầu ra là biến liên tục (A) (B) Study | ES [95% Conf. Interval] % Weight Study |ES [95% Conf. Interval] % Weight -------------------- +---------------------------------------- --------------------- +------------------------------------- Choe, 2023 | 2.000 -36.680 40.680 1.57 Choe, 2023 | 2.000 -36.680 40.680 1.74 Fichtlscherer, 2005 | 35.150 -17.790 88.090 0.84 Fichtlscherer, 2005 | 35.150 -17.790 88.090 0.93 Hong, 2023 | -8.900 -18.320 0.520 26.54 Hong, 2023 | -8.900 -18.320 0.520 27.83 Kim, 2022 | -9.500 -15.420 -3.580 67.20 Kim, 2022 | -9.500 -15.420 -3.580 65.28 Oh, 2020 | 14.100 -16.500 44.700 2.52 Oh, 2020 | 14.100 -16.500 44.700 2.77 Oh, 2021 |-10.200 -52.380 31.980 1.32 Oh, 2021 | -10.200 -52.380 31.980 1.46 -------------------- +---------------------------------------- --------------------- +------------------------------------- I-V pooled ES | -8.200 -13.053 -3.347 100.00 D+L pooled ES | -8.076 -13.180 -2.973 100.00 ---------------- --- +---------------------------------------- ----------------------+------------------------------------- Heterogeneity calculated by formula Heterogeneity calculated by formula Q = SIGMA_i{ (1/variance_i)*(effect_i - effect_pooled)^2 } Q = SIGMA_i{ (1/variance_i)*(effect_i - effect_pooled)^2 } where variance_i = ((upper limit - lower limit)/(2*z))^2 where variance_i = ((upper limit - lower limit)/(2*z))^2 Heterogeneity chi-squared = 5.10 (d.f. = 5) p = 0.404 Heterogeneity chi-squared = 5.10 (d.f. = 5) p = 0.404 I-squared (variation in ES attributable to heterogeneity) = 1.9% I-squared (variation in ES attributable to heterogeneity) = 1.9% Estimate of between-study variance Tau-squared = 1.2621 Test of ES=0 : z= 3.31 p = 0.001 Test of ES=0 : z= 3.10 p = 0.002 150 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.02.18
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 Hình 9. Biểu đồ rừng kết quả phân tích gộp sử dụng mô hình (A) tác động cố định và (B) tác động ngẫu nhiên về hiệu quả giảm triglyceride của việc sử dụng statin liều cao so với statin liều thấp phối hợp ezetimibe trên bệnh nhân tim mạch xơ vữa Hình 10. Kết quả kiểm định Egger và kiểm định Begg đánh giá sai lệch xuất bản các nghiên cứu về hiệu quả giảm triglyceride của việc sử dụng statin liều cao so với statin liều thấp phối hợp ezetimibe trên bệnh nhân tim mạch xơ vữa https://doi.org/10.32895/hcjm.m.2025.02.18 https://www.tapchiyhoctphcm.vn | 151
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 Bên cạnh đó, tính bất đồng nhất về khác biệt giữa kết quả nhau để chỉnh sửa theo nhu cầu. Tuy nhiên, tính năng tuỳ các nghiên cứu thành phần được thể hiện qua chỉ số I2. Với chỉnh hình ảnh sẽ linh hoạt hơn trong phần mềm R với gói bổ kết quả 1,9%, các nghiên cứu thành phần không có sự dị biệt. sung “ggplot2”. Các kết quả về mức độ ảnh hưởng và tính bất đồng nhất cũng Ngoài ra, trong STATA, “metan” là một gói do người dùng được thể hiện trong biểu đồ rừng (Hình 9). viết và được sử dụng rộng rãi cho phân tích gộp, trong khi Sai lệch xuất bản “meta”, được giới thiệu từ STATA 16, là một lệnh tích hợp với khả năng tương thích tốt hơn, cải thiện đồ họa và hỗ trợ Để đánh giá sai lệch xuất bản, trước tiên sai số chuẩn (biến các phân tích nâng cao như phân tích hồi quy gộp. Do được semd) của KBTB ở từng nghiên cứu thành phần được tính StataCorp duy trì, “meta” được cập nhật liên tục trong hệ sinh thông qua hàm generate theo câu lệnh sau: thái của STATA, cũng là một lựa chọn tốt khi thực hiện phân • generate semd = (ul-ll)/(2*1.96) tích gộp. Bên cạnh chi phí phần mềm thì STATA cũng chưa Sau đó, kiểm định Egger và kiểm định Begg cho sai lệch xây dựng phương pháp tính toán cho các trường hợp số biến cố trong nhóm bằng 0. Trong trường hợp này, nghiên cứu viên xuất bản được tiến hành sử dụng hàm metabias theo câu lệnh: có thể tiếp tục đưa vào phân tích bằng cách cộng thêm 0,5 vào • metabias md semd, egger cả hai nhóm để tính toán cho những trường hợp này. • metabias md semd, begg Sau cùng, việc thực hiện phân tích gộp cần cân nhắc lựa Kết quả giá trị p=0,07 trong kiểm định Egger và p=0,13 chọn mô hình tác động cố định hoặc mô hình tác động ngẫu trong kiểm định Begg (p >0,05) cho thấy không có sai lệch nhiên một cách phù hợp dựa trên mức độ bất đồng nhất giữa xuất bản trong các nghiên cứu đánh giá hiệu quả giảm các nghiên cứu đưa vào phân tích, xem xét các nguyên nhân triglyceride của việc sử dụng statin liều cao so với statin liều trong trường hợp các nghiên cứu có tính bất đồng nhất cao, thấp phối hợp ezetimibe trên bệnh nhân tim mạch xơ vữa áp dụng các phương pháp điều chỉnh như trim-and-fill trong (Hình 10). trường hợp có sai lệch xuất bản, cũng như tiến hành các phân tích độ nhaỵ loại bỏ từng nghiên cứu để kiểm tra ảnh hưởng của chúng tới kết quả chung. 4. BÀN LUẬN Sử dụng dữ liệu các nghiên cứu thành phần từ hai phân tích 5. KẾT LUẬN gộp trước đây, chúng tôi đã trình bày các bước tiến hành phân tích gộp trong STATA để giải thích từng bước cần thiết và cho Trong nghiên cứu này, chúng tôi tập trung giới thiệu cách ra kết quả được báo cáo trong các bài báo. Các dữ liệu sử thực hiện phân tích gộp trong các tình huống khác nhau liên dụng và nội dung các câu lệnh được tổng hợp tại quan đến dữ liệu đầu vào cũng như kết quả đầu ra của nghiên [https://docs.google.com/spreadsheets/d/15_pqR1wZmzg8V cứu gốc. Chúng tôi hi vọng rằng bài viết sẽ góp phần đưa ra tx3lxeeg_7jQrcLW6ve/edit?usp=sharing&ouid=103413854 hướng dẫn cách sử dụng phần mềm STATA để thực hiện các 052784170139&rtpof=true&sd=true]. phân tích gộp nhằm tạo ra kết quả nghiên cứu phục vụ cho y Mặc dù là một phần mềm trả phí, nhưng STATA được thiết học dựa trên bằng chứng. kế thân thiện với người dùng, cho phép nhập dữ liệu dễ dàng bằng cách sao chép trực tiếp từ bảng Excel mà không cần sử Nguồn tài trợ dụng mã lệnh nhập dữ liệu cụ thể như trong phần mềm R. So Nghiên cứu không nhận tài trợ. với phần mềm RevMan, một phần mềm miễn phí và dễ sử dụng được thiết kế bởi Cochrane, thì STATA được sử dụng Xung đột lợi ích với nhiều tính năng hơn. Đặc biệt, STATA cũng cung cấp nhiều tùy chọn hiển thị cho biểu đồ rừng, và cũng có thể chỉnh Không có xung đột lợi ích tiềm ẩn nào liên quan đến bài viết sửa thủ công bằng cách lưu dưới dạng tệp metafile, đưa vào này được báo cáo. Microsoft PowerPoint và tách biểu đồ thành nhiều lớp khác 152 | https://www.tapchiyhoctphcm.vn https://doi.org/10.32895/hcjm.m.2025.02.18
- Tạp chí Y học Thành phố Hồ Chí Minh * Tập 28 * Số 2 * 2025 ORCID BMJ. 1997;315(7109):629-34. Hoàng Tùng 5. Macaskill P, Walter SD, Irwig L. A comparison of https://orcid.org/0000-0001-6653-3406 methods to detect publication bias in meta-analysis. Stat Trương Mai Vân Med. 2001;20(4):641-54. https://orcid.org/0000-0002-1473-9485 6. Zheng SL, Roddick AJ. Association of aspirin use for Nguyễn Thị Huyền Trâm primary prevention with cardiovascular events and https://orcid.org/0009-0002-7419-3274 bleeding events: a systematic review and meta-analysis. Trần Tiểu Trang JAMA. 2019;321(3):277-87. https://orcid.org/0009-0001-4426-0184 7. Kelly FA, Moraes FCA, Lôbo AOM, Siebel VM, Leite M, Almeida AM, et al. Safety and efficacy of moderate- Đóng góp của các tác giả intensity statin plus ezetimibe versus high-intensity Ý tưởng nghiên cứu: Hoàng Tùng, Trương Mai Vân statin monotherapy in patients with atherosclerotic Đề cương và phương pháp nghiên cứu: Nguyễn Thị Huyền cardiovascular disease: A meta-analysis. J Clin Lipidol. Trâm, Trần Tiểu Trang 2024;18(6):e893-e904. Giám sát nghiên cứu: Hoàng Tùng Nhập dữ liệu: Hoàng Tùng Phân tích dữ liệu: Hoàng Tùng Viết bản thảo đầu tiên: Hoàng Tùng, Trương Mai Vân Góp ý bản thảo và đồng ý cho đăng bài: Hoàng Tùng, Trương Mai Vân, Nguyễn Thị Huyền Trâm, Trần Tiểu Trang Cung cấp dữ liệu và thông tin nghiên cứu Tác giả liên hệ sẽ cung cấp dữ liệu nếu có yêu cầu từ Ban biên tập. TÀI LIỆU THAM KHẢO 1. Ratnani I, Fatima S, Abid MM, Surani Z, Surani S. Evidence-based medicine: history, review, criticisms, and pitfalls. Cureus. 2023;15(2):e35266. 2. Lee YH. An overview of meta-analysis for clinicians. Korean J Intern Med. 2018;33(2):277-83. 3. Higgins JP, Thompson SG. Quantifying heterogeneity in a meta-analysis. Stat Med. 2002;21(11):1539-58. 4. Egger M, Davey Smith G, Schneider M, Minder C. Bias in meta-analysis detected by a simple, graphical test. https://doi.org/10.32895/hcjm.m.2025.02.18 https://www.tapchiyhoctphcm.vn | 153

ADSENSE
CÓ THỂ BẠN MUỐN DOWNLOAD
Thêm tài liệu vào bộ sưu tập có sẵn:

Báo xấu

LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
