
Đánh giá hiệu quả tác động sư phạm của một hướng nghiên cứu khoa học giáo dục: Tiếp cận từ kỹ thuật meta-analysis
lượt xem 1
download

Bài viết "Đánh giá hiệu quả tác động sư phạm của một hướng nghiên cứu khoa học giáo dục: Tiếp cận từ kỹ thuật meta-analysis" trình bày quy trình bảy bước và các công cụ phân tích của kỹ thuật metaanalysis (phân tích gộp) để tổng hợp số liệu thống kê từ các kết quả nghiên cứu cùng một chủ đề nghiên cứu trong lĩnh vực khoa học giáo dục. Mời các bạn cùng tham khảo!
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Đánh giá hiệu quả tác động sư phạm của một hướng nghiên cứu khoa học giáo dục: Tiếp cận từ kỹ thuật meta-analysis
- GIÁO DỤC HỌC ĐÁNH GIÁ HIỆU QUẢ TÁC ĐỘNG SƯ PHẠM CỦA MỘT HƯỚNG NGHIÊN CỨU KHOA HỌC GIÁO DỤC: TIẾP CẬN TỪ KỸ THUẬT META-ANALYSIS GS.TS Trần Trung1, TS. Phạm Đức Bình2 1 Học viện Dân tộc 2 Trường Đại học Khoa học và Công nghệ Hà Nội Tác giả liên hệ: trungt1978@gmail.com Ngày nhận: 09/12/2024 Ngày nhận bản sửa: 14/12/2024 Ngày duyệt đăng: 24/12/2024 Tóm tắt Đối với mỗi đề tài nghiên cứu khoa học giáo dục thường hướng đến mục tiêu đề xuất các tác động sư phạm nhằm đổi mới và nâng cao hiệu quả giáo dục, trong đó, kết quả thực nghiệm sư phạm sẽ là bằng chứng khoa học cho độ tin cậy và tính khả thi của kết quả nghiên cứu. Tuy nhiên, từ mẫu thực nghiệm nhỏ khi suy luận lên quần thể sẽ phải chấp nhận sai số nhất định, vì vậy, khi đánh giá hiệu quả tác động sư phạm của một hướng nghiên cứu cụ thể thì nhà nghiên cứu luôn mong muốn gộp số liệu thực nghiệm từ một số mẫu nghiên cứu khác nhau nhằm tăng hệ số tin cậy của các biện pháp sư phạm. Bài viết này trình bày quy trình bảy bước và các công cụ phân tích của kỹ thuật meta- analysis (phân tích gộp) để tổng hợp số liệu thống kê từ các kết quả nghiên cứu cùng một chủ đề nghiên cứu trong lĩnh vực khoa học giáo dục. Kỹ thuật meta-analysic áp dụng trọng số (weight) cho từng nghiên cứu độc lập được sử dụng dựa vào kích thước mẫu và độ ổn định của từng nghiên cứu, giúp giải quyết sự không đồng nhất trong kết quả từ các nghiên cứu độc lập nhằm tính toán chính xác hơn cỡ tác động (effect size) của một giả thuyết với cỡ mẫu lớn hơn so với cỡ mẫu được sử dụng trong các nghiên cứu thành phần, hỗ trợ loại bỏ sự sai lệch của các nghiên cứu độc lập, qua đó, tăng tính khách quan của kết quả nghiên cứu, nâng tiềm năng tái lập kết quả nghiên cứu và giúp xác định các giả thiết khoa học mới và tiềm năng cho các nghiên cứu trong tương lai. Từ khóa: Khoa học giáo dục, meta-analysic, PRISMA, systematic review, tác động sư phạm. The Evaluation of the Effectiveness of the Pedagogical Impact of a Research Direction in Educational Science: An Approach from the Meta-Analysis Technique Prof. Dr. Tran Trung1, Dr. Pham Duc Binh2 1 Vietnam Academy for Ethnic Minorities 2 University of Science and Technology of Hanoi Corresponding Author: trungt1978@gmail.com Abstract For each educational science research topic, the primary aim is often to propose pedagogical impacts aimed at innovating and improving the effectiveness of education, where the results of pedagogical experiments provide scientific evidence regarding the reliability and feasibility of the research outcomes. However, certain errors must be accepted when inferring from a small experimental sample to a larger population. Therefore, when evaluating the effectiveness of pedagogical impacts of a specific research direction, researchers often aim to combine experimental data from various research samples to increase the reliability of the pedagogical methods. This article outlines the seven-step process and the analytical tools of the meta-analysis technique to 188 Tạp chí KH&CN Trường Đại học Hòa Bình - Số Đặc biệt - Tháng 12.2024
- GIÁO DỤC HỌC synthesize statistical data from research results on the same topic in educational science. The meta-analysis technique applies weights to each independent study based on sample size and the stability of the findings, helping to address the heterogeneity in results from independent studies to more accurately calculate the effect size of a hypothesis with a larger sample size compared to the sample size used in the individual studies. This supports the elimination of bias in independent studies, thereby increasing the objectivity of the research results, enhancing the potential for replication of the research outcomes, and helping to identify new and promising scientific hypotheses for future studies. Keywords: Educational Science, meta-analysis, PRISMA, systematic review, pedagogical impact. 1. Mở đầu cộng sự, 2014), ngược lại, một số nghiên cứu Đối với các nghiên cứu thực nghiệm sư khác chỉ ra rằng lớp học đảo ngược cải thiện phạm hoặc nghiên cứu can thiệp, một chủ đề hiệu quả học tập của sinh viên và tối ưu hơn nghiên cứu có thể được thực hiện bởi nhiều phương pháp học truyền thống (Cotta và các nhóm nghiên cứu (cùng thuộc một quốc gia, cộng sự, 2016; Hughes và các cộng sự, 2016). hoặc thuộc các quốc gia khác nhau). Những Từ hai ví dụ trên, chúng ta có thể thấy rằng sự nhóm nghiên cứu này thực hiện nghiên cứu bất đồng trong các kết quả nghiên cứu thuộc ở những thời điểm và những khu vực khác cùng một chủ đề sẽ gây khó khăn cho người nhau, với những đối tượng nghiên cứu khác đọc hoặc những nhà nghiên cứu khác khi họ nhau, do đó, tuy chủ đề nghiên cứu là tương không thể kết luận được kết quả từ nghiên cứu đồng nhưng kết quả từ những nghiên cứu này độc lập nào là chính xác và đáng tin cậy. Từ có thể không đồng nhất. Ví dụ, trong một thực tế đó, phương pháp phân tích gộp được nghiên cứu phân tích gộp về mức độ hiệu quả ra đời với mục đích tổng hợp và phân tích kết trong việc sử dụng các phần mềm hình học quả của tất cả các bài báo cùng nghiên cứu động (Dynamic Geometry Software) trong về một chủ đề, qua đó, rút ra được một kết dạy học toán, Juandi và các cộng sự (2021) luận duy nhất về tính hiệu quả hướng nghiên đã cho thấy sự không đồng nhất về kết luận cứu chung của những nghiên cứu độc lập này. trong các nghiên cứu độc lập đã được công Phân tích gộp là một trong những phương bố. Trong khi nhiều nghiên cứu đã chỉ ra sự pháp nghiên cứu chính để tổng hợp các kết hiệu quả của việc sử dụng các phần mềm hình quả của một câu hỏi nghiên cứu hoặc một lĩnh học động trong việc cải thiện khả năng học vực nghiên cứu, cung cấp những đánh giá toán của học sinh so với các phương pháp học định lượng về mức độ hiệu quả của các nghiên toán truyền thống (Baki và các cộng sự, 2011; cứu thực nghiệm sư phạm hoặc nghiên cứu Drigas & Pappas; Papadakis và các cộng sự, can thiệp thông qua việc tính toán cỡ tác động 2017, 2018; Sudirman và các cộng sự, 2020), của từng nghiên cứu thành phần. Thông qua một vài nghiên cứu khác lại có kết luận ngược việc tính toán cỡ tác động, kết quả của mỗi lại (Hamidah và các cộng sự, 2020; Septian & nghiên cứu thành phần có thể được so sánh Komala, 2019). Một ví dụ khác về sự không với nhau. Ngoài ra, phân tích gộp còn được sử đồng nhất về kết quả nghiên cứu thực nghiệm dụng để kiểm tra các giả thuyết còn gây tranh sư phạm có thể được tìm thấy trong một nghiên cãi khi các kết quả nghiên cứu về giả thuyết cứu phân tích gộp tìm hiểu về mức độ hiệu này cho ra những kết quả không đồng nhất quả của lớp học đảo ngược. Gillette và các khi được thực hiện bởi những nhóm nghiên cộng sự (2018) đã chỉ ra rằng một số nghiên cứu khác nhau (Hansen và các cộng sự, 2022). cứu đã kết luận rằng sinh viên không thấy Tuy có nhiều điểm tương đồng nhưng ý nghĩa sự khác biệt giữa việc tham gia lớp học đảo và bằng chứng khoa học của các nghiên cứu ngược và lớp học truyền thống (Suda và các phân tích gộp được xếp cao nhất, trên một bậc Số Đặc biệt - Tháng 12.2024 - Tạp chí KH&CN Trường Đại học Hòa Bình 189
- GIÁO DỤC HỌC so với các nghiên cứu phân tích tổng quan hệ giải quyết sự không đồng nhất trong kết quả thống trong mô hình tháp phân cấp mức độ từ các nghiên cứu độc lập, và giúp tính toán quan trọng của các loại nghiên cứu khác nhau. chính xác hơn cỡ tác động tổng hợp (pooled Trong lĩnh vực khoa học giáo dục, kết quả effect) của một giả thuyết với cỡ mẫu lớn hơn từ các nghiên cứu về phân tích gộp có thể hỗ nhiều so với cỡ mẫu được sử dụng trong các trợ nhà nghiên cứu và giáo viên trong việc lựa nghiên cứu thành phần. Lưu ý rằng độ chính chọn các phương pháp dạy và học phù hợp xác của kết quả phân tích gộp sẽ tỉ lệ thuận với học sinh. Người nghiên cứu có thể xem với kích thước cỡ mẫu; (iii) Phân tích gộp loại xét áp dụng các biện pháp can thiệp hoặc hỗ bỏ sự thiên vị trong việc lựa chọn các nghiên trợ học sinh đã được chứng minh có hiệu quả cứu độc lập, qua đó, tăng tính khách quan của (nếu kết quả phân tích gộp chỉ ra giá trị cỡ kết quả nghiên cứu; (iv) Tất cả các nghiên cứu tác động lớn). Ví dụ, một nghiên cứu phân độc lập được sử dụng cho phân tích gộp đều tích gộp trên đối tượng là học sinh khuyết được trích dẫn rõ ràng, do đó, kết quả nghiên tật nhẹ đã chỉ ra rằng mô hình dạy học kết cứu từ phân tích tích gộp có khả năng được hợp giữa sự nhắc nhở của giáo viên và việc tái lập bởi các nhóm nghiên cứu khác; (v) Kết lặp lại thường xuyên các bài thực hành có thể quả từ phân tích gộp giúp người nghiên cứu giúp nâng cao kết quả học tập của học sinh xác định các giả thiết mới và tiềm năng cho (Swanson & Hoskyn, 1998). Do đó, giáo viên các nghiên cứu trong tương lai. có thể áp dụng phương pháp học này để hỗ Mặc dù phân tích gộp là một phương pháp trợ học sinh khuyết tật nâng cao kết quả học rất hiệu quả trong việc tổng hợp kết quả từ các tập. Tuy nhiên, kết quả của các nghiên cứu nghiên cứu độc lập, tuy nhiên, khi thực hiện phân tích gộp không phải lúc nào cũng chính một nghiên cứu phân tích gộp, người nghiên xác tuyệt đối, do đó, người nghiên cứu cần cứu sẽ gặp phải một số thách thức như sau: phải đánh giá được chất lượng của nghiên cứu (i) Thực hiện một nghiên cứu phân tích gộp phân tích gộp, và kết hợp với những kiến thức thường tốn rất nhiều thời gian trong việc tìm khác trước khi quyết định có áp dụng kết quả kiếm và tổng hợp tài liệu. Ngoài ra, người của phân tích gộp cho việc giảng dạy của giáo nghiên cứu cần được trang bị tốt nhiều kỹ viên hay không. năng như: kỹ năng đọc hiểu, tổng hợp tài liệu, Nhiều nghiên cứu đã thống nhất rằng và kỹ năng lập trình. Do đó, không dễ dàng để phân tích gộp hiệu quả hơn phân tích tổng hoàn thành một nghiên cứu phân tích gộp có quan truyền thống, và phân tích gộp đã khắc chất lượng tốt; (ii) Phân tích gộp không thể phục được các nhược điểm của phân tích tổng tiến hành ở tất cả các ngành khoa học. Phân quan truyền thống thông qua việc áp dụng một tích gộp chỉ phổ biến ở một số lĩnh vực khoa quy trình minh bạch nhằm giải quyết sự không học như: y học, sinh học, khoa học sức khỏe, đồng nhất trong kết quả của những nghiên cứu tâm lý học và giáo dục học; (iii) Nếu phân độc lập, qua đó, đưa ra được những kết luận tích gộp tổng hợp các kết quả thuộc các chủ quan trọng và đáng tin cậy (Lee, 2019; Stone đề nghiên cứu quá khác nhau thì kết quả cỡ & Rosopa, 2017). Những ưu điểm khác của tác động tổng hợp sẽ không có nhiều ý nghĩa phân tích gộp có thể được chỉ ra như sau: (i) khoa học; (iv) Nếu phân tích gộp sử dụng đầu Phân tích gộp áp dụng trọng số (weight) cho vào có một (hoặc một vài) nghiên cứu độc lập từng nghiên cứu độc lập được sử dụng, dựa có chất lượng kém thì kết quả sẽ bị sai lệch và vào kích thước mẫu sử dụng và độ ổn định của không chính xác (garbage in, garbage out). Do từng nghiên cứu, do đó, kết quả nghiên cứu đó, trong bước thiết kế nghiên cứu, cần phải từ phân tích gộp là kết quả tổng hợp của các xác định rất rõ các tiêu chí lựa chọn nghiên nghiên cứu thành phần, và có độ chính xác, cứu độc lập để làm đầu vào cho phân tích độ tin cậy cao hơn so với kết quả của từng gộp để có thể tìm kiếm được những nghiên nghiên cứu riêng lẻ; (ii) Phân tích gộp giúp cứu có chất lượng tốt nhất. Nếu người nghiên 190 Tạp chí KH&CN Trường Đại học Hòa Bình - Số Đặc biệt - Tháng 12.2024
- GIÁO DỤC HỌC cứu không tìm được tất cả những nghiên cứu Bước 1. Xác định câu hỏi nghiên cứu cho độc lập có cùng chủ đề nghiên cứu làm đầu phân tích gộp. vào, thì kết luận của phân tích gộp có thể bị Tương tự như tất cả các nghiên cứu khoa sai lệch; (v) Một trong những yêu cầu khi thực học khác, việc đầu tiên khi tiến hành một nghiên hiện phân tích gộp là người nghiên cứu phải cứu phân tích gộp là xác định câu hỏi nghiên thu thập được tất cả những tài liệu hoặc kết quả cứu. Khi xác định câu hỏi nghiên cứu, có hai nghiên cứu từ nhiều nguồn khác nhau để đánh vấn đề mà người nghiên cứu cần lưu tâm. Thứ giá một giả thuyết nghiên cứu. Mặc dù vậy, nhất, người nghiên cứu cần tìm hiểu xem hướng thực tế là một nghiên cứu phân tích gộp chỉ nghiên cứu đó có phát triển trong vài thập kỷ sử dụng một số ít các nghiên cứu độc lập (hầu gần đây, có nhiều bài báo được công bố không? hết là những bài báo khoa học được công bố Một mặt, nhiều bài báo đã được công bố sẽ giúp trên các tạp chí chuyên ngành). Ngoài ra, còn tăng khả năng người nghiên cứu tìm được các có nhiều nghiên cứu cùng chủ đề nhưng chưa công bố có liên quan, qua đó, tăng khả năng có được công bố, hoặc không được công bố trên thể thực hiện thành công nghiên cứu phân tích các tạp chí chuyên ngành. Do đó, khi thực hiện gộp. Mặt khác, việc tìm kiếm, phân loại và lựa phân tích gộp, người nghiên cứu phải nỗ lực tối chọn từ một số lượng lớn tài liệu để tìm ra các đa trong việc tìm kiếm những tài liệu (đã công nghiên cứu có liên quan để sử dụng cho phân bố và chưa công bố) có liên quan đến hướng tích gộp là một công việc tốn rất nhiều thời gian nghiên cứu; (vi) Sai lệch xuất bản (publication của người nghiên cứu. Do đó, Steel và các cộng bias) là hiện tượng các nhà xuất bản thường có sự (2021) đã nhấn mạnh tầm quan trọng của việc xu hướng xuất bản những nghiên cứu chứng phải cân bằng giữa số lượng tài liệu có liên quan minh được tác động tích cực của một can thiệp. và khả năng quản lý của người nghiên cứu trong Những nghiên cứu chỉ ra tác động không rõ việc định nghĩa câu hỏi nghiên cứu. Thứ hai, số ràng của một can thiệp thường không được ưu lượng bài báo về phân tích gộp ở tất cả các lĩnh tiên xuất bản, hoặc thậm chí không được tác vực đều tăng mạnh trong những năm gần đây, giả gửi đến nhà xuất bản. Do đó, nếu chúng do đó, có khả năng là một (hoặc một vài) nghiên ta thực hiện phân tích gộp với dữ liệu đầu vào cứu phân tích gộp có cùng chủ đề (hoặc chủ đề hoàn toàn là những bài báo khoa học đã được gần) với câu hỏi nghiên cứu mà tác giả định thực công bố thì kết quả của phân tích gộp có thể hiện đã được công bố. Do đó, người nghiên cứu sẽ không phản ánh đúng và đánh giá cao hơn phải xác định được hướng nghiên cứu về phân (overestimate) hiệu quả thật của can thiệp. tích gộp mình đang quan tâm đã được những 2. Quy trình thực hiện phân tích gộp trong nhà khoa học khác triển khai hay chưa. Với đánh giá hiệu quả tác động sư phạm của một những hướng nghiên cứu đã có các công bố về hướng nghiên cứu khoa học giáo dục phân tích gộp, người nghiên cứu hoàn toàn có Nghiên cứu về quy trình các bước thực thể thực hiện lại để kiểm tra các kết luận từ các hiện một nghiên cứu phân tích gộp có thể được bài báo đã công bố (trong trường hợp nghi ngờ tìm thấy ở nhiều bài báo đã công bố (Basu, tính chính xác của các kết quả đã công bố), hoặc 2017; Tawfik và các cộng sự, 2019; Hansen và cập nhật các kết quả mới sử dụng những nghiên các cộng sự, 2022), tuy nhiên, chủ yếu trình cứu độc lập mới được công bố. Việc cập nhật bày về quy trình thực hiện phân tích gộp áp các kết quả phân tích gộp thường xuyên là rất dụng cho lĩnh vực y tế và khoa học quản lý. quan trọng, vì nó cung cấp nhiều thông tin quan Mặc dù không có quá nhiều khác biệt trong quy trọng cho cộng đồng khoa học. trình thực hiện một phân tích gộp ở các lĩnh Bước 2. Tìm kiếm các nghiên cứu có vực khác nhau, trong bài viết này, chúng tôi liên quan. đề xuất một quy trình 7 bước cơ bản khi thực Quy trình tìm kiếm tài liệu khi thực hiện hiện một nghiên cứu phân tích gộp, áp dụng phân tích gộp cần phải có tính hệ thống và cho ngành khoa học giáo dục như sau: minh bạch để có thể tìm được tất cả các tài Số Đặc biệt - Tháng 12.2024 - Tạp chí KH&CN Trường Đại học Hòa Bình 191
- GIÁO DỤC HỌC liệu có liên quan, và đặc biệt là phải có khả được tất cả những nghiên cứu có liên quan. năng tái lập kết quả nghiên cứu. Theo Harari Cần lưu ý rằng kết quả nghiên cứu của những và các cộng sự (2020), khi thực hiện việc tìm luận án tiến sĩ có chất lượng tốt cũng có thể kiếm tài liệu cho phân tích gộp, người nghiên được sử dụng làm đầu vào cho phân tích gộp. cứu có thể tham khảo một số chiến lược tìm Tuy nhiên, thông thường những kết quả của kiếm sau. Thứ nhất, người nghiên cứu có thể luận án sẽ được người nghiên cứu công bố sử dụng những kết quả phân tích gộp đã công trên các tạp chí khoa học chuyên ngành. bố có cùng chủ đề hoặc chủ đề có liên quan để Bước 3. Xây dựng tiêu chí loại bỏ và lựa lọc ra một danh sách những nghiên cứu độc chọn nghiên cứu độc lập cho phân tích gộp. lập có thể sử dụng, cũng như để hiểu kỹ hơn Bước tiếp theo, người nghiên cứu phải về chủ đề đang nghiên cứu. Tuy nhiên, chiến xây dựng một bảng các tiêu chí để loại bỏ và lược tìm kiếm này chỉ có thể áp dụng khi đã lựa chọn các nghiên cứu độc lập để làm dữ có những công bố phân tích gộp có cùng chủ liệu đầu vào cho phân tích gộp. Lưu ý rằng, đề nghiên cứu được xuất bản. Chiến lược tìm bước này cần được thực hiện bởi tối thiểu hai kiếm thứ hai, phổ biến hơn, đó là tìm kiếm nhà khoa học khác nhau một cách độc lập, sau tài liệu thông qua tìm kiếm từ khóa (keyword đó, kết quả cần được so sánh và thảo luận để search) trên các cơ sở dữ liệ (CSDL) điện có thể đưa ra một danh sách cuối cùng những tử. Chiến lược tìm kiếm này sẽ giúp người tài liệu sẽ được sử dụng. Các tiêu chí loại bỏ nghiên cứu tìm được tối đa số lượng tài liệu và lựa chọn bài báo đầu vào cho phân tích gộp có liên quan, bao gồm cả “tài liệu xám” (grey không cố định, và phụ thuộc chủ yếu vào câu literature) chưa được xuất bản. Để loại bỏ sự hỏi nghiên cứu và mục đích nghiên cứu. Tuy sai lệch kết quả tìm kiếm gây ra do sự giới nhiên, một số tiêu chí sau đây sẽ giúp người hạn phạm vi bao phủ của một CSDL, người nghiên cứu loại bỏ được đa phần những tài nghiên cứu được khuyến nghị nên sử dụng ít liệu không liên quan. Đầu tiên, phải loại bỏ nhất hai CSDL khác nhau khi tìm kiếm tài liệu những bài báo trùng lặp ở các CSDL được sử (DeSimone và các cộng sự, 2020). Có 5 CSDL dụng để tìm kiếm. Tiếp theo, người nghiên khoa học phổ biến nhất và thuận tiện nhất cho cứu cần đọc tiêu đề, tóm tắt và từ khóa của việc tìm kiếm những bài báo có liên quan ở những bài báo còn lại để loại bỏ những bài hầu hết tất cả những lĩnh vực khoa học phổ báo rõ ràng không có liên quan đến câu hỏi biến trước khi thực hiện phân tích gộp bao nghiên cứu (đa số tài liệu sẽ bị loại bỏ ở bước gồm: Scopus, Web of Science (WoS), Google này). Ở bước này, nếu có sự mâu thuẫn trong Scholar (GS), Microsoft Academic (MA) và quyết định giữa hai người thực hiện, cần Dimensions. Đồng thời, còn có các CSDL phải đọc toàn văn tài liệu để quyết định giữ đặc thù cho các ngành khoa học khác như: lại hoặc loại bỏ nghiên cứu. Với các bài báo y học, sinh học (PubMed, Medline), tâm lý còn lại, người nghiên cứu phải đọc toàn văn học (PsycINFO), kinh tế học, và giáo dục học để nắm được nội dung của bài báo, sau đó, (ERIC). Để hạn chế việc có quá nhiều kết quả đưa ra quyết định giữ lại hoặc loại bỏ tài liệu. tìm kiếm, gây khó khăn cho công đoạn xử lý Cuối cùng, số lượng bài báo còn lại sẽ được dữ liệu, người nghiên cứu phải xác định chính sử dụng làm đầu vào cho phân tích gộp. Trong xác câu hỏi nghiên cứu và các từ khóa được sử lĩnh vực khoa học giáo dục, một số tiêu chí dụng để tìm kiếm dữ liệu. Ngoài ra, việc thu sau thường được sử dụng để giữ lại hoặc loại thập những tài liệu có liên quan nhưng chưa bỏ bài báo: (1) Thiết kế nghiên cứu: bài báo được công bố, hoặc chỉ được công bố ở các phải là một nghiên cứu thực nghiệm sư phạm hội thảo khoa học quốc gia, quốc tế, hoặc thu hoặc nghiên cứu can thiệp; (2) Nguồn công thập tài liệu thông qua mối quan hệ cá nhân bố: bài báo phải được công bố trên các tạp chí của người nghiên cứu với những nhà khoa khoa học uy tín, có phản biện; (3) Đối tượng học khác cũng là một cách để có thể tìm kiếm nghiên cứu của bài báo: học sinh tiểu học, 192 Tạp chí KH&CN Trường Đại học Hòa Bình - Số Đặc biệt - Tháng 12.2024
- GIÁO DỤC HỌC trung học cơ sở, trung học phổ thông, hoặc học, Khoa học, Tiếng Anh, Ngoại ngữ, và các sinh viên đại học; (4) Cỡ mẫu: cỡ mẫu của môn học không phải STEM); Thời gian tiến nghiên cứu phải đủ lớn để sai số lấy mẫu nằm hành thực nghiệm sư phạm. Để tóm tắt các trong ngưỡng cho phép, và kết quả của nghiên công đoạn thực hiện trong bước này, sơ đồ cứu có ý nghĩa thống kê. Theo nghiên cứu của luồng PRISMA có thể được sử dụng. Hình 1 Lin (2018), cỡ mẫu tối thiểu của một nghiên là một ví dụ về sơ đồ luồng PRISMA được sử cứu sử dụng trong phân tích gộp cần nằm dụng trong một phân tích gộp đánh giá về mức trong khoảng từ 5-10; Nghiên cứu áp dụng độ hiệu quả của lớp học đảo ngược (Gillette cho hai nhóm đối tượng: nhóm được tác động và các cộng sự, 2018). Từ sơ đồ này, chúng và nhóm không được tác động; Môn học được ta có thể hiểu được các bước nhóm tác giả đã tiến hành thực nghiệm (Toán học, Vật lý, Hóa thực hiện để tìm kiếm tài liệu: Hình 1. Ví dụ về sơ đồ luồng PRISMA được sử dụng trong phân tích gộp về mức độ hiệu quả của lớp học đảo ngược (Gillette và các cộng sự, 2018) Bước 4. Lựa chọn phần mềm thực hiện cho phân tích gộp (cả phần mềm thương phân tích gộp. mại và phần mềm mã nguồn mở). Việc lựa Các phần mềm hỗ trợ thực hiện phân tích chọn phần mềm để thực hiện phân tích gộp gộp rất đa dạng, từ những hàm tích hợp sẵn phụ thuộc nhiều vào mức độ phức tạp của (built-in function) đến các gói hỗ trợ được phương pháp phân tích và dữ liệu đầu vào cài đặt trong các phần mềm thống kê, và sử dụng. Các chức năng và ứng dụng của các phần mềm được thiết kế chuyên dụng các phần mềm là không giống nhau, do đó, Số Đặc biệt - Tháng 12.2024 - Tạp chí KH&CN Trường Đại học Hòa Bình 193
- GIÁO DỤC HỌC người nghiên cứu phải biết được phần mềm động tổng hợp. Nhiều nhà khoa học thường định sử dụng có khả năng thực hiện những sử dụng phần mềm Microsoft Excel cho bước phân tích mà họ muốn thực hiện hay không. mã hóa dữ liệu. Trong số những phần mềm thương mại, Bước 6. Thực hiện các kỹ thuật phân Stata (từ phiên bản v.16) cung cấp các chức tích gộp cơ bản. năng thực hiện phân tích gộp và vẽ đồ thị. Kỹ thuật phân tích đầu tiên cần thực hiện Phần mềm SPSS và SAS cũng cung cấp một đó là phân tích các giá trị ngoại lai (nếu có) số chức năng cho phép thực hiện phân tích trong các nghiên cứu độc lập được sử dụng gộp. Phần mềm mã nguồn mở như JASP và để đảm bảo chất lượng của kết quả phân tích R cung cấp nhiều gói chức năng giúp thực gộp. Một vài mô hình thống kê có thể được hiện phân tích gộp. Ví dụ, gói công cụ meta sử dụng để phân tích các giá trị ngoại lai và metaphor trong phần mềm R được trang (Aguinis và các cộng sự, 2013; Viechtbauer bị hầu hết các chức năng cơ bản và cần thiết & Cheung, 2010). Tuy nhiên, hiện nay, các để thực hiện phân tích gộp, và thường được nhà khoa học vẫn đang tranh luận về việc khuyến nghị cho những người mới tìm hiểu giữ lại hay loại bỏ những giá trị ngoại lai về phân tích gộp (Viechtbauer, 2010). Ngoài này khi thực hiện phân tích gộp. Trong một ra, Microsoft Excel cũng được trang bị một số trường hợp, các giá trị ngoại lai này là số chức năng giúp thực hiện một vài kỹ thuật hợp lệ, tuy nhiên, nhiều trường hợp khác, các phân tích gộp đơn giản, ví dụ như gói Meta- giá trị ngoại lai này lại không hợp lệ. Do đó, Essentials (Suurmond và các cộng sự, 2017). người nghiên cứu cần so sánh kết quả thực Cuối cùng, Comprehensive Meta-Analysis, hiện phân tích gộp có sử dụng và không sử Rayyan.AI và RevMan là những phần mềm dụng các giá trị ngoại lai, sau đó, mới đưa ra thương mại, được phát triển riêng cho nghiên kết luận giữ lại hoặc loại bỏ các nghiên cứu cứu phân tích gộp. độc lập có các giá trị ngoại lai này. Bước 5. Mã hóa dữ liệu. Tiếp theo, sai lệch xuất bản (publication Sau khi lựa chọn được những nghiên cứu bias) là hiện tượng khả năng được chấp nhận độc lập để sử dụng làm đầu vào cho phân đăng của một nghiên cứu phụ thuộc vào kết tích gộp, người nghiên cứu cần mã hóa dữ quả đầu ra của nghiên cứu đó. Điều này xảy ra liệu của từng nghiên cứu độc lập này. Mã do các nhà xuất bản, các tạp chí có xu hướng hóa dữ liệu phục vụ hai mục đích chính. Thứ ưu tiên chấp nhận đăng những nghiên cứu mà nhất, mã hóa dữ liệu giúp người nghiên cứu kết quả của nghiên cứu đó chứng minh được làm rõ được bối cảnh nghiên cứu, đối tượng một giả thuyết ban đầu, hoặc cho thấy mức độ được tiến hành nghiên cứu, và phương pháp hiệu quả cao của một phương pháp can thiệp nghiên cứu được sử dụng trong từng bài báo, đến học sinh (Scherer RW & von Elm, 2007). qua đó, người nghiên cứu có thể hiểu được Những nghiên cứu có kết luận mức độ hiệu hạn chế của từng nghiên cứu. Ví dụ, nếu các quả thấp, hoặc phương pháp can thiệp không nghiên cứu độc lập chỉ được tiến hành với có tác động lên học sinh thường không được học sinh tiểu học thì các kết luận có được khi ưu tiên công bố, công bố chậm, hoặc thậm chí thực hiện phân tích gộp chỉ đúng với học sinh nhiều tác giả không gửi bản thảo của những tiểu học mà không thể áp dụng cho học sinh nghiên cứu này đến tạp chí. Theo thống kê trung học cơ sở hoặc trung học phổ thông. của Dickersin và các cộng sự (1987), trong Thứ hai, mã hóa dữ liệu giúp xác định được lĩnh vực y học lâm sàng, những bài báo chỉ sự biến thiên của cỡ tác động, bối cảnh, số ra mức độ hiệu quả cao của một can thiệp sẽ lượng mẫu, cũng như những đặc điểm khác có khả năng được xuất bản cao hơn ba lần so của từng nghiên cứu. Người nghiên cứu cần với những bài báo kết luận mức độ hiệu quả sử dụng những số liệu này để tính toán cỡ tác của một phương pháp can thiệp không có ý 194 Tạp chí KH&CN Trường Đại học Hòa Bình - Số Đặc biệt - Tháng 12.2024
- GIÁO DỤC HỌC nghĩa thống kê. Tuy nhiên, sai lệch xuất bản sử dụng trong phân tích gộp. Trục hoành chỉ là một trong số những yếu tố tác động đến (trục x) thể hiện cỡ tác động, trong khi trục kết quả và chất lượng của phân tích gộp. Các tung (trục y) thể hiện sai số chuẩn của từng yếu tố khác bao gồm: (i) Số lượng trích dẫn nghiên cứu. Những nghiên cứu quan trọng, (citation bias): Kể cả khi đã được công bố, có tác động lớn sẽ phân bố phía trên đỉnh những bài báo kết luận một phương pháp can của hình tam giác, trong khi những nghiên thiệp không có tác động, hoặc có tác động tiêu cứu ít quan trọng hơn sẽ phân bố ở phía dưới cực lên học sinh sẽ ít được trích dẫn trong các đáy của hình tam giác. Thông thường, trục công bố sau này. Điều này sẽ khiến việc tìm tung của biểu đồ phễu sẽ bị đảo ngược, nghĩa kiếm những công bố này khó khăn hơn so với là, những nghiên cứu phân bố ở phía trên những công bố có nhiều trích dẫn. (ii) Thời hình tam giác sẽ có giá trị sai số thấp. Trong gian xuất bản (time-lag bias): Những nghiên trường hợp không có sai lệch xuất bản, các cứu chứng minh kết quả tích cực của một can điểm dữ liệu trong biểu đồ phễu sẽ tạo thành thiệp thường được công bố sớm hơn so với một hình phễu ngược và đối xứng gần đúng những nghiên cứu có kết quả không thuận với nhau. Các nghiên cứu nằm ở phía trên lợi. (iii) Ngôn ngữ sử dụng (language bias): (sai số thấp) sẽ nằm gần nhau, trong khi các Phần lớn công bố khoa học ở tất cả các lĩnh nghiên cứu nằm ở phía dưới (sai số tăng dần) vực nghiên cứu đều được xuất bản sử dụng được phân bố đều và mở rộng ra cả hai phía ngôn ngữ tiếng Anh. Do đó, người nghiên cứu của biểu đồ phễu. Mặc dù có tính trực quan thông thường sẽ không hoặc ít tiếp cận với cao, tuy nhiên, việc phân tích sai lệch xuất những công bố được viết bằng các ngôn ngữ bản chỉ dựa vào đánh giá định tính biểu đồ khác tiếng Anh. (iv) Sai lệch kết quả được phễu còn có nhiều hạn chế, đặc biệt trong đưa vào công bố (outcome reporting bias): trường hợp số lượng nghiên cứu độc lập ít Khi tiến hành một nghiên cứu, người nghiên (nhỏ hơn 10 nghiên cứu) (Sedgwick, 2013). cứu có thể đo lường và đánh giá tác động của Ngoài ra, không có một quy tắc cụ thể nào một phương pháp can thiệp lên nhiều tiêu chí để có thể đưa ra một kết luận chính xác về khác nhau của học sinh. Tuy nhiên, trong một sai lệch xuất bản trong trường hợp kết quả số trường hợp, người nghiên cứu chỉ báo cáo của biểu đồ phễu quá bất đối xứng. Sự bất những tác động tích cực và không đưa những đối xứng này có thể bị gây ra bởi các yếu tố tác động tiêu cực của can thiệp vào nội dung khác như các yếu tố liên quan đến số lượng bài báo công bố. trích dẫn, thời gian xuất bản, ngôn ngữ sử Từ những phân tích trên, chúng ta có dụng, hoặc sai lệch kết quả được đưa vào bài thể thấy rằng sai lệch xuất bản và các yếu báo. Do đó, bên cạnh việc sử dụng biểu đồ tố khác có thể gây ảnh hưởng lớn đến kết phễu, người nghiên cứu cần đánh giá sai lệch quả và sự chính xác của một nghiên cứu xuất bản sử dụng những con số định lượng phân tích gộp. Do đó, người nghiên cứu cần thông qua kiểm định hồi quy Egger (Egger’s phải thực hiện đánh giá sai lệch xuất bản. Regression Test), kiểm định Trim-và-Fill Để đánh giá có hay không sự sai lệch xuất (Trim-and-Fill test), và kiểm định không an bản trong tập hợp những nghiên cứu độc lập toàn N (fail-safe N). Người đọc có thể tìm được sử dụng, thông thường người nghiên hiểu thêm về những kiểm định này tại nghiên cứu sẽ sử dụng biểu đồ phễu (funnel plot). cứu của Nakagawa và các cộng sự (2022). Biểu đồ phễu là một biểu đồ phân bố của các Lưu ý rằng người nghiên cứu không nên chỉ nghiên cứu độc lập, cỡ tác động và độ chính sử dụng duy nhất một kiểm định, mà nên sử xác của các nghiên cứu này. Hình 2 minh họa dụng cùng lúc nhiều kiểm định để có thể đánh một biểu đồ phễu, trong đó, mỗi chấm tròn giá được chính xác nhất có hay không sai đại diện cho một nghiên cứu độc lập được lệch xuất bản (Harrison và các cộng sự, 2014). Số Đặc biệt - Tháng 12.2024 - Tạp chí KH&CN Trường Đại học Hòa Bình 195
- GIÁO DỤC HỌC Hình 2. Ví dụ về biểu đồ phễu (funnel plot) giúp đánh giá sai lệch suất bản trong phân tích gộp Nguồn: https://www.statisticshowto.com/funnel-plot/ Các nghiên cứu độc lập sử dụng cho phân để ước lượng tính không đồng nhất trong phân tích gộp được thực hiện bởi những nhóm tích gộp. Kiểm định I2 ước tính tỷ lệ phần trăm nghiên cứu khác nhau, ở những thời gian và thay đổi trong kết quả giữa các nghiên cứu độc địa điểm khác nhau, với những đối tượng lập dựa trên sự khác biệt thật sự chứ không nghiên cứu khác nhau, và thời gian chịu tác phải do ngẫu nhiên. Kiểm định I2 tính toán động khác nhau. Do đó, sự không đồng nhất mức độ không đồng nhất bằng cách lấy kết quả về kết quả của những nghiên cứu này là điều của kiểm định Q chia cho số bậc tự do của giá được mong đợi. Tuy nhiên, người nghiên cứu trị Q. Nếu I2 bằng 0%, sự không đồng nhất là cần xác định xem mức độ không đồng nhất do tình cờ. I2 ít hơn 25% được coi là mức độ giữa các nghiên cứu độc lập này có thể chấp không đồng nhất thấp, I2 từ 25-50% được coi nhận được hay không trước khi tiến hành các là mức độ không đồng nhất trung bình, và I2 bước tiếp theo của phân tích gộp. Ngoài ra, lớn hơn 50% được coi là mức độ không đồng việc đánh giá tính không đồng nhất của các nhất cao. Điểm hạn chế của kiểm định I2 là nó nghiên cứu độc lập còn rất quan trọng vì điều chỉ cung cấp một giá trị về tính không đồng này ảnh hưởng đến quyết định lựa chọn mô nhất của toàn bộ các nghiên cứu độc lập chứ hình thống kê sẽ được sử dụng ở các bước tiếp không cung cấp thông tin về yếu tố nào gây theo (Huedo-Medina và các cộng sự, 2006). ra sự không đồng nhất này. Đây cũng là điểm Một vài phương pháp thống kê có thể được sử hạn chế của kiểm định Q. Sau khi chạy kiểm dụng để đánh giá tính không đồng nhất, bao định Q và kiểm định I2, phân tích hồi quy meta gồm: kiểm định Cochrane’s Q, kiểm định I2, và (meta-regression) có thể được sử dụng để xác phân tích hồi quy meta (meta-regression). Kiểm định các yếu tố gây ra sự không đồng nhất. Lưu định Cochrane’s Q (kiểm định Q) là một kiểm ý rằng hầu hết các phần mềm hỗ trợ thực hiện định truyền thống, thường xuyên được sử dụng phân tích gộp đều cung cấp các công cụ để tính để xác định tính không đồng nhất trong phân toán giá trị của các kiểm định này. tích gộp. Dựa trên phân bố chi bình phương Sau khi hoàn thành đánh giá tác động của (chi-square), kiểm định Q tính toán một giá trị giá trị ngoại lai, đánh giá sai lệch xuất bản, và xác suất. Giá trị xác suất này càng lớn cho thấy đánh giá tính không đồng nhất, bước tiếp theo tính không đồng nhất càng cao giữa các nghiên người nghiên cứu cần thực hiện là lựa chọn mô cứu độc lập được sử dụng. Một hạn chế của hình thống kê sẽ sử dụng cho nghiên cứu phân kiểm định Q là kết quả sẽ không chính xác nếu tích gộp, bao gồm mô hình thống kê cố định số lượng nghiên cứu độc lập được sử dụng ít (fixed-effects model) hoặc mô hình thống kê hơn 10. Do đó, người nghiên cứu được khuyến ngẫu nhiên (random-effects model). Nếu các cáo nên sử dụng giá trị p lớn (p > 0.05) làm nghiên cứu độc lập chỉ khác nhau bởi sai số ngưỡng có ý nghĩa thống kê khi sử dụng kiểm lấy mẫu (sampling error), nghĩa là, tính không định Q để xác định tính không đồng nhất. Kiểm đồng nhất thấp thì mô hình thống kê cố định định I2 là một phương pháp mới được sử dụng sẽ được sử dụng. Ngược lại, nếu có các khác 196 Tạp chí KH&CN Trường Đại học Hòa Bình - Số Đặc biệt - Tháng 12.2024
- GIÁO DỤC HỌC biệt khác ngoài sai số lấy mẫu, nghĩa là, tính khoa học; (ii) Có thể tính toán được: Cần phải không đồng nhất cao thì mô hình thống kê có đủ các tham số cần thiết để có thể tính toán ngẫu nhiên sẽ được sử dụng. Như đã trình bày được cỡ tác động của tất cả các nghiên cứu độc ở phần trên, người nghiên cứu thường kỳ vọng lập sử dụng cho phân tích gộp; (iii) Đáng tin tính không đồng nhất cao giữa các nghiên cứu cậy: Ngay cả khi có thể tính toán được cỡ tác độc lập do những nghiên cứu này được thực động của tất cả các nghiên cứu độc lập, sai số hiện bởi những nhóm nghiên cứu khác nhau, ở chuẩn của cỡ tác động thành phần phải được những thời gian và địa điểm khác nhau, và đối tính toán trước khi tổng hợp tất cả các tham tượng được nghiên cứu là khác nhau. Do đó, đa số này. Một điểm quan trọng nữa cần lưu ý là phần những phân tích gộp trong lĩnh vực khoa định dạng của cỡ tác động cần phải phù hợp học giáo dục, và cả trong những lĩnh vực khoa với kỹ thuật phân tích được sử dụng; (iv) Có học khác sẽ sử dụng mô hình thống kê ngẫu thể giải thích được: Sau khi được tính toán từ nhiên. Trong trường hợp tính không đồng nhất các nghiên cứu độc lập, cỡ tác động tổng hợp thấp, và mô hình thống kê cố định được lựa phải phù hợp để trả lời những câu hỏi nghiên chọn, một số nhà khoa học vẫn khuyến khích cứu đã được đặt ra. nên sử dụng cả mô hình thống kê ngẫu nhiên Cỡ tác động của các nghiên cứu độc lập, (Borenstein và các cộng sự, 2007). cỡ tác động tổng hợp và một vài thông số quan Bước tiếp theo người nghiên cứu cần thực trọng khác của phân tích gộp (khoảng tin cậy hiện là tính toán cỡ tác động tổng hợp (pooled và trọng số của mỗi nghiên cứu) có thể được size) thông qua tổng hợp cỡ tác động (effect biểu diễn thông qua một biểu đồ rừng (forest size) của từng nghiên cứu độc lập. Cỡ tác động plot). Hình 3 là một ví dụ về một biểu đồ rừng là một giá trị định lượng thể hiện độ lớn về tiêu chuẩn và các thành phần chính của nó. Cột mức độ hiệu quả của một can thiệp. Cỡ tác ngoài cùng bên trái thể hiện tên (và năm công động càng lớn thì mức độ hiệu quả càng cao. bố) của các nghiên cứu độc lập được sử dụng Cỡ tác động thường được biểu diễn bằng ký tự cho phân tích gộp. Với mỗi nghiên cứu, cỡ “p”. Theo Cohen (1962), p ≤ 0.1 tương ứng với tác động được biểu diễn bằng một hình vuông mức độ hiệu quả thấp, p = 0.3 tương ứng với ở trung tâm của biểu đồ rừng. Đường thẳng mức độ hiệu quả trung bình, và p ≥ 0.5 tương song song với trục hoành, chạy qua tâm của ứng với mức độ hiệu quả cao. Đôi khi, cỡ tác mỗi hình vuông thể hiện khoảng tin cậy 95% động của các nghiên cứu độc lập đã được các (confidence interval). Kích thước của mỗi hình tác giả báo cáo trong bài báo, tuy nhiên, thông vuông tỉ lệ thuận với cỡ mẫu của nghiên cứu thường thì người nghiên cứu phải tự tính toán độc lập. Cỡ mẫu càng lớn thì hình vuông càng cỡ tác động của những nghiên cứu độc lập từ lớn, và nghiên cứu đó có trọng số càng cao. Ba những dữ liệu được công bố trong những bài cột còn lại trên biểu đồ rừng lần lượt thể hiện báo này (bao gồm: cỡ mẫu, giá trị trung bình, giá trị của cỡ tác động, khoảng tin cậy 95%, và độ lệch chuẩn của nhóm đối chứng và nhóm và trọng số của từng nghiên cứu. Ở phía dưới bị can thiệp trước và sau khi can thiệp). Người biểu đồ, hình thoi thể hiện giá trị của cỡ tác đọc có thể tìm hiểu thêm về công thức và cách động tổng hợp. Hai đầu mút trái và phải của tính cỡ tác động của các nghiên cứu độc lập hình thoi thể hiện khoảng tin cậy 95%. Lưu ý trong nghiên cứu của Vo và các cộng sự (2017). rằng nếu hình thoi cắt đường thẳng đứng đi qua Cỡ tác động tổng hợp là một trong những kết điểm 0 thì người nghiên cứu có thể kết luận quả quan trọng nhất của phân tích gộp, do đó, rằng phương pháp can thiệp không có tác động. phương pháp tính toán cỡ tác động cần phải Tất cả các kết quả thể hiện trên biểu đồ rừng thỏa mãn một số điều kiện sau (Harrer và các cần phải rõ ràng, chính xác, và phải có tính tái cộng sự, 2021): (i) Có thể so sánh được: Cỡ thiết lập (nghĩa là nếu người nghiên cứu khác tác động của các nghiên cứu độc lập phải có sử dụng cùng một bộ dữ liệu đầu vào thì kết khả năng so sánh được với nhau, và có ý nghĩa quả đầu ra phải giống nhau). Số Đặc biệt - Tháng 12.2024 - Tạp chí KH&CN Trường Đại học Hòa Bình 197
- GIÁO DỤC HỌC Hình 3. Ví dụ về một biểu đồ rừng tiêu chuẩn (Harrer và các cộng sự, 2021) Ngoài ra, người nghiên cứu có thể tùy biến các ngành học có liên quan và không liên quan đến cách thể hiện một biểu đồ rừng cho phù hợp với STEM (Vo và các cộng sự, 2017). Từ biểu đồ rừng nội dung nghiên cứu. Hình 4 là một ví dụ về một ở Hình 4, chúng ta có thể kết luận rằng phương biểu đồ rừng thể hiện cỡ tác động của từng nghiên pháp dạy học kết hợp có tác động tích cực đến cứu độc lập, cỡ tác động tổng hợp được tính toán kết quả học tập của sinh viên đại học, và phương từ 40 nghiên cứu về mức độ hiệu quả của phương pháp này có tác động tích cực hơn tới sinh viên các pháp dạy học kết hợp (blended learning) tới hiệu ngành học có liên quan đến STEM so với sinh viên quả học tập của sinh viên đại học đang theo học các ngành không liên quan đến STEM. Hình 4. Ví dụ về một biểu đồ rừng trong một nghiên cứu phân tích gộp đánh giá mức độ hiệu quả của phương pháp dạy học kết hợp (blended learning) tới kết quả học tập của sinh viên đại học (Vo và các cộng sự, 2017) Những kỹ thuật phân tích được trình bày thể tiếp tục thực hiện những kỹ thuật phân tích trong bước 6 là những kỹ thuật cơ bản, cần phải nâng cao. Trong phạm vi của bài viết này, chúng có của một bài báo phân tích gộp. Sau khi hoàn tôi sẽ không đề cập đến những kỹ thuật nâng thành những phân tích này, người nghiên cứu có cao này. Người đọc có thể tìm đọc thêm tại sách 198 Tạp chí KH&CN Trường Đại học Hòa Bình - Số Đặc biệt - Tháng 12.2024
- GIÁO DỤC HỌC chuyên khảo về phân tích gộp của Harrer và các các ý tưởng và các hướng nghiên cứu tiềm năng cộng sự (2021). trong tương lai. Bước 7. Tổng hợp kết quả và viết báo cáo. 3. Kết luận Bước cuối cùng khi thực hiện phân tích gộp Thông thường, các kết quả được trình bày là tổng hợp các kết quả đã thực hiện ở các bước trong một bài báo phân tích gộp có độ tin cậy trên và viết báo cáo. Điều quan trọng nhất với cao, tuy nhiên, trong một vài trường hợp, kết báo cáo tổng hợp là phương pháp nghiên cứu quả nghiên cứu từ những bài báo phân tích gộp và tất cả những bước đã được thực hiện phải đã được xuất bản có thể không chính xác tuyệt được trình bày một cách tường minh và dễ hiểu. đối, hoặc thậm chí cung cấp các kết luận sai DeSimone và các cộng sự (2020) đã cung cấp lầm. Thứ nhất, kết luận từ một phân tích gộp một danh sách những tiêu chí cần phải có khi không đáng tin cậy khi kết quả này được tổng thực hiện phân tích gộp. Người nghiên cứu có hợp dựa trên nhiều dạng nghiên cứu khác nhau, thể dựa vào những tiêu chí này để đảm bảo rằng hoặc phương pháp đo lượng kết quả của những tất cả những tiêu chí quan trọng nhất khi thực nghiên cứu độc lập này không giống nhau, hoặc hiện phân tích gộp đã được các tác giả thực hiện. chủ đề nghiên cứu của những nghiên cứu độc Đối với các phân tích gộp định lượng, chúng ta lập quá khác biệt. Thứ hai, nghiên cứu phân tích có thể sử dụng bảng danh sách các tiêu chí được gộp sử dụng kết quả của cả những bài báo có xây dựng bởi Levitt và các cộng sự (2018). Đối chất lượng tốt và chất lượng không tốt. Điều này với phân tích gộp định lượng, bảng biểu cần có sẽ dẫn đến những kết luận sai lầm hoặc thiếu các thông tin quan trọng như cỡ tác động trung sót. Thứ ba, nếu một nghiên cứu phân tích gộp bình (mean effect size), sai số chuẩn (standard không báo cáo đầy đủ các bước tác giả tiến hành error) và khoảng tin cậy (confidence interval), triển khai nghiên cứu, điều này sẽ gây khó khăn cỡ mẫu của từng nghiên cứu độc lập (sample cho người đọc trong việc đánh giá chất lượng và size), và mức độ đồng nhất của các nghiên cứu. độ tin cậy của kết quả nghiên cứu. Thứ tư, phân Nếu số lượng nghiên cứu độc lập sử dụng cho tích gộp sử dụng cùng một bộ dữ liệu các nghiên phân tích gộp không quá nhiều, cần cung cấp cứu độc lập làm đầu vào nhưng lại cho ra những một biểu đồ rừng nhằm tổng quan sự khác biệt kết quả khác nhau. Thứ năm, nếu một trong số và độ chính xác của từng nghiên cứu thành những nghiên cứu độc lập được sử dụng làm đầu phần. Cần lưu ý rằng, việc sử dụng biểu đồ rừng vào cho phân tích gộp có kích thước mẫu quá là không khả thi khi có quá nhiều nghiên cứu vượt trội so với những nghiên cứu khác thì kết độc lập trong bộ dữ liệu đầu vào. Tất cả những quả phân tích gộp có thể bị sai lệch. Cuối cùng, kết quả được thể hiện trên hình vẽ và bảng biểu nếu một phân tích gộp sử dụng những bài báo có cần phải được giải thích rõ ràng trong báo cáo. mức độ sai lệch xuất bản lớn (high publication Quan trọng hơn, người nghiên cứu cần phải trả bias) làm dữ liệu đầu vào, thì sẽ dẫn đến những lời được câu hỏi nghiên cứu đã đưa ra. Ví dụ, kết luận không chính xác. Từ những vấn đề phương pháp can thiệp được sử dụng có tác trên, người nghiên cứu cần phải có đủ kiến thức động tích cực, tiêu cực, hoặc không có tác động chuyên môn để có thể đánh giá được chất lượng đến học sinh. Ngoài ra, từ kết quả của phân tích của một phân tích gộp trước khi quyết định có gộp, người nghiên cứu có thể trình bày thêm về sử dụng các kết quả này. Tài liệu tham khảo Aguinis, H., Gottfredson, R. K., & Joo, H. (2013). Best-Practice Recommendations for Defining, Identifying, and Handling Outliers. Organizational Research Methods, 16(2), 270–301. https://doi. org/10.1177/1094428112470848 Baki, A., Kosa, T., & Guven, B. (2011). A comparative study of the effects of using dynamic geometry software and physical manipulatives on the spatial visualisation skills of pre-service mathematics teachers. British Journal of Educational Technology, 42(2), 291–310. https://doi.org/10.1111/j.1467-8535.2009.01012.x Số Đặc biệt - Tháng 12.2024 - Tạp chí KH&CN Trường Đại học Hòa Bình 199
- GIÁO DỤC HỌC Basu, A. (2017). How to conduct meta-analysis: a basic tutorial. PeerJ Preprints, 5:e2978v1. https://doi. org/10.7287/peerj.preprints.2978v1 Borenstein, M., Hedges, L., & Rothstein, H. (2007). "Meta-analysis: Fixed effect vs. random effects". Wiley. https://www.meta-analysis.com/downloads/Meta-analysis_fixed_effect_vs_random_effects 072607.pdf Cohen, J. (1962). The statistical power of abnormal-social psychological research: A review. The Journal of Abnormal and Social Psychology, 65(3), 145–153. https://doi.org/doi.org/10.1037/h0045186 Cotta, K. I., Shah, S., Almgren, M. M., Macías-Moriarity, L. Z., & Mody, V. (2016). Effectiveness of flipped classroom instructional model in teaching pharmaceutical calculations. Currents in Pharmacy Teaching and Learning, 8(5), 646–653. https://doi.org/10.1016/j.cptl.2016.06.011 DeSimone, J. A., Brannick, M. T., O’Boyle, E. H., & Ryu, J. W. (2020)."Recommendations for Reviewing Meta-Analyses in Organizational Research. Organizational Research Methods, 24(4), 694–717. https://doi. org/10.1177/1094428120967089 Dickersin, K., Chan, S., Chalmersx, T. C., Sacks, H. S., & Smith, H. (1987).Publication bias and clinical trials. Controlled Clinical Trials, 8(4), 343–353. https://doi.org/https://doi.org/10.1016/0197-2456(87)90155-3 Drigas, A., & Pappas, M. (2015). A Review of Mobile Learning Applications for Mathematics. International Journal of Interactive Mobile Technologies (IJIM), 9(3), 18–23. https://doi.org/10.3991/ijim.v9i3.4420 Gillette, C., Rudolph, M., Kimble, C., Rockich-Winston, N., Smith, L., & Broedel-Zaugg, K. (2018). A Meta-Analysis of Outcomes Comparing Flipped Classroom and Lecture. American Journal of Pharmaceutical Education, 82(5). https://doi.org/10.5688/ajpe6898 Hamidah, N., Afidah, I., Setyowati, L., Sutini, S., & Junaedi, J. (2020). Pengaruh Media Pembelajaran Geogebra Pada Materi Fungsi Kuadrat Terhadap Motivasi dan Hasil Belajar Peserta Didik. Journal of Education and Learning Mathematics Research (JELMaR), 1(1), 15–24. https://doi.org/10.37303/jelmar.v1i1.2 Hansen, C., Steinmetz, H., & Block, J. (2022). How to conduct a meta-analysis in eight steps: a practical guide. Management Review Quarterly, 72(1), 1–19. https://doi.org/10.1007/s11301-021-00247-4 Harari, M. B., Parola, H. R., Hartwell, C. J., & Riegelman, A. (2020). Literature searches in systematic reviews and meta-analyses: A review, evaluation, and recommendations. Journal of Vocational Behavior, 118, 103377. https://doi.org/10.1016/j.jvb.2020.103377 Harrer, M., Cuijpers, P., Furukawa, T. ., & Ebert, D. . (2021). Doing Meta-Analysis with R: A Hands-On Guide (1st ed.). Chapman and Hall/CRC. https://doi.org/10.1201/9781003107347 Harrison, J. S., Banks, G. C., Pollack, J. M., O’Boyle, E. H., & Short, J. (2014). Publication Bias in Strategic Management Research. Journal of Management, 43(2), 400–425. https://doi.org/10.1177/0149206314535438 Huedo-Medina, T. B., Sánchez-Meca, J., Marín-Martínez, F., & Botella, J. (2006). Assessing heterogeneity in meta-analysis: Q statistic or I2 index?" Psychological Methods, 11(2), 193–206. https://doi.org/10.1037/1082- 989X.11.2.193 Hughes, P. J., Waldrop, B., & Chang, J. (2016). Student perceptions of and performance in a blended foundational drug information course. Currents in Pharmacy Teaching and Learning, 8(3), 359–363. https:// doi.org/10.1016/j.cptl.2016.02.013 Juandi, D., Kusumah, Y. S., Tamur, M., Perbowo, K. S., Siagian, M. D., Sulastri, R., & Negara, H. R. P. (2021). The Effectiveness of Dynamic Geometry Software Applications in Learning Mathematics: A Meta- Analysis Study. International Journal of Interactive Mobile Technologies (IJIM), 15(02), 18–37. https://doi. org/10.3991/ijim.v15i02.18853 Lee, Y. H. (2019). Strengths and Limitations of Meta-Analysis. Korean J Med, 94(5), 391–395. https://doi. org/10.3904/kjm.2019.94.5.391 Levitt, H. M., Bamberg, M. G., Creswell, J. W., Frost, D. M., Josselson, R., & Suárez-Orozco, C. (2018). Journal article reporting standards for qualitative primary, qualitative meta-analytic, and mixed methods research in psychology: The APA Publications and Communications Board task force report. The American Psychologist, 73 1, 26–46. Lin, L. (2018). Bias caused by sampling error in meta-analysis with small sample sizes. PLOS ONE, 13(9), 1–19. https://doi.org/10.1371/journal.pone.0204056 Nakagawa, S., Lagisz, M., Jennions, M. D., Koricheva, J., Noble, D. W. A., Parker, T. H., Sánchez-Tójar, A., Yang, Y., & O’Dea, R. E. (2022). Methods for testing publication bias in ecological and evolutionary meta- analyses. Methods in Ecology and Evolution, 13(1), 4–21. https://doi.org/10.1111/2041-210X.13724 200 Tạp chí KH&CN Trường Đại học Hòa Bình - Số Đặc biệt - Tháng 12.2024
- GIÁO DỤC HỌC Papadakis, S., Kalogiannakis, M., & Zaranis, N. (2017). Improving Mathematics Teaching in Kindergarten with Realistic Mathematical Education. Early Childhood Education Journal, 45(3), 369–378. https://doi. org/10.1007/s10643-015-0768-4 Papadakis, S., Kalogiannakis, M., & Zaranis, N. (2018). The effectiveness of computer and tablet assisted intervention in early childhood students’ understanding of numbers. An empirical study conducted in Greece. Education and Information Technologies, 23(5), 1849–1871. https://doi.org/10.1007/s10639-018-9693-7 Scherer RW, L. P., & von Elm, E. (2007). Full publication of results initially presented in abstracts. Cochrane Database of Systematic Reviews, 2. https://doi.org/10.1002/14651858.MR000005.pub3 Sedgwick, P. (2013). Meta-analyses: how to read a funnel plot. BMJ, 346. https://doi.org/10.1136/ bmj.f1342 Septian, A., & Komala, E. (2019). Kemampuan Koneksi Matematik Dan Motivasi Belajar Siswa Dengan Mengunakan Model Problem-Based Learning (Pbl) Berbantuan Geogebra Di Smp. Prisma, 8(1), 1. https://doi. org/10.35194/jp.v8i1.438 Steel, P., Beugelsdijk, S., & Aguinis, H. (2021). The anatomy of an award-winning meta-analysis: Recommendations for authors, reviewers, and readers of meta-analytic reviews. Journal of International Business Studies, 52(1), 23–44. https://doi.org/10.1057/s41267-020-00385-z Stone, D. L., & Rosopa, P. J. (2017). The Advantages and Limitations of Using Meta-analysis in Human Resource Management Research. Human Resource Management Review, 27(1), 1–7. https://doi.org/10.1016/j. hrmr.2016.09.001 Suda, K. J., Sterling, J. M., Guirguis, A. B., & Mathur, S. K. (2014). Student perception and academic performance after implementation of a blended learning approach to a drug information and literature evaluation course. Currents in Pharmacy Teaching and Learning, 6(3), 367–372. https://doi.org/10.1016/j. cptl.2014.02.017 Sudirman, S., Mellawaty, M., Yaniawati, P., & Indrawan, R. (2020). Integrating Local Wisdom Forms in Augmented Reality Application: Impact Attitudes, Motivations and Understanding of Geometry of Pre-service Mathematics Teachers’. International Journal of Interactive Mobile Technologies (IJIM), 14(11 SE-Papers), 91–106. https://doi.org/10.3991/ijim.v14i11.12183 Suurmond, R., van Rhee, H., & Hak, T. (2017). Introduction, comparison, and validation of Meta- Essentials: A free and simple tool for meta-analysis. Research Synthesis Methods, 8(4), 537–553. https://doi. org/10.1002/jrsm.1260 Swanson, H. L., & Hoskyn, M. (1998). Experimental Intervention Research on Students with Learning Disabilities: A Meta-Analysis of Treatment Outcomes. Review of Educational Research, 68(3), 277–321. https://doi.org/10.3102/00346543068003277 Tawfik, G. M., Dila, K. A. S., Mohamed, M. Y. F., Tam, D. N. H., Kien, N. D., Ahmed, A. M., & Huy, N. T. (2019). A step by step guide for conducting a systematic review and meta-analysis with simulation data. Tropical Medicine and Health, 47(1), 46. https://doi.org/10.1186/s41182-019-0165-6 Viechtbauer, W. (2010). Conducting Meta-Analyses in R with the metafor Package. Journal of Statistical Software, 36(3), 1–48. https://doi.org/10.18637/jss.v036.i03 Viechtbauer, W., & Cheung, M. W.-L. (2010). Outlier and influence diagnostics for meta-analysis. Research Synthesis Methods, 1(2), 112–125. https://doi.org/10.1002/jrsm.11 Vo, H. M., Zhu, C., & Diep, N. A. (2017). The effect of blended learning on student performance at course-level in higher education: A meta-analysis. Studies in Educational Evaluation, 53, 17–28. https://doi. org/10.1016/j.stueduc.2017.01.002 Số Đặc biệt - Tháng 12.2024 - Tạp chí KH&CN Trường Đại học Hòa Bình 201

CÓ THỂ BẠN MUỐN DOWNLOAD
-
Báo cáo thực tập tốt nghiệp: Hoàn thiện công tác Văn thư - Lưu trữ tại văn phòng trường ĐHBK Hà Nội
59 p |
2094 |
592
-
Luận văn Thạc sĩ Ngữ văn: Ngôn ngữ nghệ thuật của Nhất Linh trong các sáng tác trước năm 1945
0 p |
303 |
62
-
Một số đề xuất nhằm nâng cao năng lực về ngôn ngữ cho học viên của các cơ sở đào tạo báo chí
4 p |
184 |
25
-
Bài giảng lớp tập huấn Dự án GDP-VNEN (Tổ chức hợp tác giáo dục toàn cầu Việt Nam Escuela Nueva)
59 p |
111 |
12
-
Tập huấn: Dự án GPE-VNEN (tổ chức hợp tác giáo dục toàn cầu Việt Nam Escuela Nueva)
59 p |
88 |
8
-
Tìm hiểu giá trị Văn hóa - Lịch sử Đồng Nai
37 p |
174 |
7
-
Khóa luận tốt nghiệp: Công tác tổ chức hoạt động thông tin qua dịch vụ chợ công nghệ và thiết bị tại Cục Thông tin Khoa học và Công nghệ Quốc gia
110 p |
91 |
6
-
Chú ý ôn tập hiệu quả nhưng không gây quá tải
3 p |
76 |
5
-
Hỗ trợ tâm lí xã hội cho trẻ sau thiên tai thảm họa: Thiết kế nội dung và đánh giá hiệu quả chương trình tập huấn nâng cao năng lực cho các nhà tâm lí, giáo dục và nhân viên công tác xã hội
8 p |
44 |
4
-
Đánh giá của cán bộ quản lí và giáo viên về quản lí hoạt động tư vấn hướng nghiệp tại các trường trung học phổ thông ở một số tỉnh miền Đông Nam Bộ
12 p |
91 |
4
-
Thực trạng hỗ trợ trẻ khiếm thị đa tật tại gia đình
6 p |
41 |
3
-
Đề thi kết thúc học phần học kì 2 môn Công tác xã hội với trẻ em năm 2020-2021 có đáp án - Trường ĐH Đồng Tháp
3 p |
26 |
3
-
Cơ sở lý luận và đề xuất các chỉ số đánh giá kết quả thực hiện công việc (KPIs) đối với giảng viên Trường Đại học Tây Nguyên
9 p |
5 |
3
-
Đề thi kết thúc học phần học kì 2 môn Tiến trình văn học năm 2021-2022 có đáp án - Trường ĐH Đồng Tháp
4 p |
13 |
2
-
Sử dụng điện thoại thông minh hữu hiệu nhằm nâng cao kết quả học môn tiếng Anh tại Trường Đại học Kinh tế Nghệ An
6 p |
4 |
1
-
Đổi mới phương pháp giảng dạy và đánh giá môn học Giáo dục quốc phòng - An ninh tại Trường Đại học Kinh tế Nghệ An
8 p |
7 |
1
-
Bài giảng Hướng dẫn đánh giá thực hiện chương trình trong các cơ sở giáo dục mầm non - Đánh giá đội ngũ thực hiện chương trình (Dành cho cán bộ quản lí, giáo viên mầm non)
15 p |
5 |
1
-
Nghiên cứu một số yếu tố tác động đến quyết định lựa chọn học đại học từ xa trực tuyến tại trường Đại học Mở Hà Nội
8 p |
1 |
1


Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn
