intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Phương pháp nghiên cứu khoa học: Phần 2 - Trường ĐH Võ Trường Toản (Năm 2022)

Chia sẻ: Lôi Vô Kiệt | Ngày: | Loại File: PDF | Số trang:66

18
lượt xem
6
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nối tiếp phần 1, phần 2 của tập bài giảng Phương pháp nghiên cứu khoa học tiếp tục cung cấp cho sinh viên những nội dung cơ bản về: phương pháp thống kê y sinh học; xác định cỡ mẫu và phương pháp chọn mẫu; sai số và nhiễu; xây dựng đề cương nghiên cứu khoa học; triển khai đề tài nghiên cứu; đạo đức trong các nghiên cứu y sinh;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng!

Chủ đề:
Lưu

Nội dung Text: Bài giảng Phương pháp nghiên cứu khoa học: Phần 2 - Trường ĐH Võ Trường Toản (Năm 2022)

  1. BÀI 4 PHƯƠNG PHÁP THỐNG KÊ Y SINH HỌC MỤC TIÊU HỌC TẬP 1. Lập được kế hoạch phân tích và trình bày số liệu 2. Lựa chọn được phương pháp thống kê phù hợp với các loại số liệu 3. Trình bày được một bộ số liệu cụ thể dưới dạng các bảng, biểu đồ và đồ thị thích hợp, và phiên giải được ý nghĩa của số liệu trong các bảng, biểu, đồ thị NỘI DUNG HỌC TẬP Việc trình bày số liệu thu thập đuợc trong nghiên cứu là một công việc hết sức quan trọng để the hiện kết quả của nghiên cứu. số liệu sau khi thu thập thuờng là hỗn độn, vì vậy, muốn từ các số liệu ấy tính toán các giá trị đặc trưng và thực hiện các kỹ thuật suy luận thống kê để rút ra những kết luận có giá trị, ta phải biết cách sắp xếp và trình bày số liệu một cách rõ ràng, gọn và có hệ thống Hai chiến luợc cơ bản giúp chúng ta tiến hành khảo sát một bộ số liệu: (1). Bắt đầu bằng khảo sát từng biến. Sau đó chuyển sang nghiên cứu mối tuơng quan giữa các biến (2). Bắt đầu với một bảng/biểu/đồ thị hoặc nhiều bảng/biểu/đồ thị. Sau đó bổ sung các số liệu tống hợp về những đặc trưng cụ thể của số liệu Chúng ta cần tuân thủ những nguyên tắc nàỵ trong suốt quá trình phân tích. Trong bài học này, chúng ta sẽ băt đâu băng việc trình bày các bảng phân phối tần số, và bằng các biểu đồ, đồ thị 1. BẢNG PHÂN PHỐI TẦN SỐ 1.1. Tiêu chuẩn của một bảng tốt Mặc dù không có một quy định nào chặt chẽ về việc trình bày số liệu bằng bảng, nhưng có một vài nguyên tắc chung đươc coi là tiêu chuẩn: + Bảng càng cần đơn giản càng tốt: nên dùng bảng đơn giản để người đọc dễ hiểu hơn là bảng phức tạp với nhiều biến số. Nhìn chung, một bảng nên chỉ được lập với tối đa là 3 biến số. + Bảng cần phải đảm bảo yếu tố tự giải thích Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 50
  2. + Các mã hóa, chữ viết tắt hoặc biểu tượng cần phải giải thích cụ thể trong phần chú thích ở cuối trang + Cần ghi rõ ràng và chính xác trong từng dòng và từng cột + Các đơn vị đo lường cụ thế cho từng số liệu cần được chỉ rõ + Tiêu đề của bảng cũng cần phải rõ ràng, chính xác và đúng trọng tâm. cần trả lời các câu hỏi: Cái gì? Khi nào? Ở đâu? + Số tổng cộng cần phải được trình bày trong bảng + Tiêu đề của bảng cần phải được phân cách với nội dung bảng bằng dòng kẻ hoặc một khoảng cách dòng. Trong các bảng nhỏ, các dòng kẻ ngang phân cách các dòng có thế không cần thiết. + Nếu số liệu là trích dẫn, thì nguồn gốc, xuất xứ của số liệu cần được chỉ rõ trong phần chú thích ở dưới bảng. 1.2. Các loại bảng phân phối tần số 1.2.1. Bảng phân phổi tần số một chiều Dùng để trình bày sự phân phối của một đặc tính khảo sát Khảo sát cho biến định tính Bảng 2. Phân bố trình độ học vấn của dân số trong độ tuổi 25-34 Số lượng Tỷ lệ phần trăm Trình độ học vấn (triệu ngưòi) (%) Chưa tốt nghiệp THPT 4,6 12,1 Tốt nghiệp THPT 11,6 30,5 Trung cấp 7,4 19,5 Cao đẳng 3,3 8,7 Đại học 8,6 22,6 Sau đại học 2,5 6,6 Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 51
  3. Khảo sát cho biến định lượng Bảng 3. Phân bố chiều cao của 40 thanh niên Ranh giới lớp Giá trị trung Tần số Tần số tương Tần số tương đối Lớp (cm) tâm (cm) (n) đối (%) cộng dồn (%) 1 150,5 - 153,5 152 1 2,5 2,5 2 153,5 - 156,5 155 3 7,5 10 3 156,5 - 159,5 158 7 17,5 27,5 4 159,5 - 162,5 161 9 22,5 50 5 162,5 - 165,5 164 8 20,5 70 6 165,5 - 168,5 167 6 15,0 85 7 168,5 -171,5 170 4 10,0 95 8 171,5 -174,5 173 2 5,0 100 Tống 40 100 Trong bảng trên, các số liệu đã được phân nhóm thành từng lớp: + Cột 1: Số thứ tự của lớp + Cột 2: Ranh giới lớp, được xác định sao cho mỗi trường hợp khảo sát phải thuộc một lớp + Cột 3: Giá trị trung tâm là giá trị đại diện cho mọi trường hợp trong lớp, được tính bằng trung bình cộng của ranh giới trên và dưới của lớp + Cột 4: Số trường hợp quan sát được trong môi lớp, được gọi là tần số của lớp + Cột 5: Tần số tương đối của lớp là tỷ lệ phần trăm giữa tần số của lớp với tống số trường hợp quan sát (ở đây là 100). Sử dụng tần số này ta có thể thực hiện được việc so sánh giữa các tập hợp số liệu đồng dạng với nhau (ví dụ chiều cao thanh niên) dù tống số trường hợp quan sát của mỗi tập hợp khác nhau. + Cột 6: Tần số tương đối cộng dồn xác định tỷ lệ phần trăm những thanh niên có chiều cao dưới một giới hạn nào đó. Ở bảng này, có 50% thanh niên có chiều cao
  4. 1.2.2. Bảng phân phối tần số hai chiều (2x2) Dùng để trình bày sự phân phối của một đặc tính khảo sát tương quan với một đặc tính khác. Bảng 4. Kết quả xét nghiêm Creatinine Kinase (CK) trên bệnh nhân nghi ngờ mắc nhồi máu cơ tim cấp tính Nhồi máu cơ tim cấp (AMI) Ket quả test CK Tổng Bệnh Không bệnh Dương tính (>80IU) 215 16 231 Âm tính (
  5. 2. Biểu đồ và đồ thị 2.1. Nguyên tắc chung Khi biểu đồ, đồ thị đã được vẽ một cách chính xác, người đọc có thể hiểu toàn bộ số liệu một cách nhanh chóng. Một vài nguyên tắc quan trọng nhất khi vẽ đồ thị là: + Dùng biểu đồ, đồ thị càng đơn giản càng có hiệu quả. + Tất cả các biểu đồ, đồ thị cần đảm bảo yếu tố tự giải thích + Tiêu đề có thể đặt ở phía dưới của biểu đồ, đồ thị + Khi có nhiều biến số được trình bày trên biểu đồ, đồ thị, thì từng biến số phải được phân biệt rõ ràng bằng lời chú giải hoặc chú dẫn + Không nên sử dụng các trục tọa độ khác khi không cần thiết + Đường biểu diễn đồ thị cần đậm hơn các trục tọa độ khác. + Tân số luôn luôn đuợc trình bày theo độ chia thăng đứng và phương pháp phân loại trình bày theo độ chia nằm ngang + Đối với độ chia số học, các độ chia bằng nhau đại diện cho các đơn vị tính như nhau + Sự phân chia các độ trên biểu đồ, đồ thị cần phải rõ ràng cũng như các đơn vị tính tương ứng trên nó. 2.2. Biểu đồ Biểu đồ là phương pháp trình bày số liệu thống kê bằng hình với một hệ tọa độ. Dưới đây là các loại biểu đồ thường dùng. 2.2.1. Biểu đồ cột (bar chart) Biểu đồ cột được sử dụng trong các trường hợp sau: + So sánh số liệu giữa hai hoặc nhiều nhóm, + Mô tả tần số tuyệt đối hoặc tần số tương đối (còn gọi là tỷ lệ) + Thể hiện các số đo lường Trong biểu đồ cột, tần số tuyệt đối hoặc tỷ lệ được thể hiện qua chiều dài các cột (độ rộng cột là như nhau). Giữa các cột có khoảng trống để nhấn mạnh tính chất không liên tục của biến số và khoảng cách này là như nhau giữa các cột (không giống như tổ chức đồ - histogram). Các cột có thể được thể hiện trên trục hoành hoặc trục tung (biểu đồ cột đứng hoặc cột nằm ngang) với cách thể hiện màu sắc hoặc làm đậm, vạch chéo khác nhau để phân biệt giữa các cột có ý nghĩa khác nhau. Tốt nhất là nên biểu diễn các cột theo thứ Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 54
  6. tự tăng lên hoặc giảm xuống cho dễ đọc với biến định danh, hoặc theo thứ bậc với biến thứ bậc. Ví dụ: Hình 6. Biểu đồ phân bố trình độ học vấn của bệnh nhân trong nghiên cứu 2.2.2. Biểu đồ tròn (pie chart) Biểu đồ hình tròn được dùng để biểu thị tỷ lệ các nhóm khác nhau của một biến số. Tổng tỷ lệ của các nhóm này phải bằng 100%, quy ước là bắt đầu từ điểm 12 giờ để chia các phần theo độ lớn khác nhau từ phần lớn nhất và tiếp tục cho đến hết toàn bộ mặt đồng hồ. Cách chuyển từ tỷ lệ sang các độ hình tròn để chia là nhân số tỷ lệ phần trăm với 3,6 vì 360°/100 = 3,6°, Ví dụ: Hình 7. Phân bố giới tình của trẻ
  7. 100% 90% 80% 70% 60% Béo phì 50% Thừa cân 40% Bình thường 30% 20% SDD 10% 0% Xã A Xã B Xã C Xã D Hình 8. Tình trạng dinh dưỡng của các xã trong nghiên cứu 2.3. Đồ thị 2.3.1. Đồ thị đường Khi chúng ta cần thể hiện xu hướng thay đổi của số liệu theo thời gian thì đồ thị dạng đường thẳng là thích hợp nhất. Một đồ thị thời gian của một biến vẽ từng quan sát theo thời gian mà tại đó quan sát được đo đạc. Thời gian được biểu diễn trên trục hoành của đồ thị và trị số của biến được bố trí ở trục tung. Nối các điểm dữ liệu sẽ giúp chỉ ra những thay đổi theo thời gian. Ví dụ: Hình 9. Số ca mắc Sốt xuất huyết vào mùa mưa của 3 xã 2.3.2. Đồ thị dạng cột liên tục – Tổ chức đồ (histogram) Dùng để diễn tả sự phân phối tần số các đặc tính định lượng liên tục. Đồ thị cột liên tục thường được vẽ dựa trên tần số tương đối.Một số điểm cần chú ý khi thực hiện vẽ đồ thị cột liên tục: + Giữa các cột không có khoảng cách do đồ thị này mô tả phân bố của một biến định lượng liên tục Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 56
  8. + Độ rộng của cột tùy thuộc vào tần số và giá trị (độ rộng) của các nhóm. + Đối với các biến có giá trị của các nhóm bằng nhau, độ rộng của các cột là tương đương, do đó khi so sánh chỉ cần chú ý tới chiều cao của các cột. Hình 10. Phân bố cân nặng sơ sinh của trẻ trong nghiên cứu 2.3.3. Đa giác tần số Nếu muốn trình bày nhiều tập hợp số liệu dưới dạng phân bố tần số thì số liệu cần được trình bày bằng đa giác tần số. Đa giác tần số được xây dựng bằng cách nối các điểm giữa của đỉnh các cột trong đồ thị dạng cột liên tục với nhau. Đường biểu diễn đa giác tần số cho ta hình dung xu thế thay đổi của đặc tính khảo sát. Một nguyên tắc khi vẽ đa giác tần số là đa giác “đóng”, nghĩa là điểm đầu và cuối phải được tiếp xúc với trúc hoành của đồ thị, và diện tích nằm trong đa giác tần số cần phải đảm bảo tương đương với phần diện tích của đồ thị tần số. 2.3.4. Đồ thị phân tán (scatter diagram) Đồ thị phân tán được dùng để biểu thị mối tương quan giữa hai biến định lượng được đo lường trên cùng các cá thể. Từng cá thể được thể hiện trên đồ thị dưới dạng từng điểm và được định vị với trị số của hai biến định lượng tương ứng trên trục tung và trục hoành cho cá thể đó. Tập hợp các diêm sẽ cho chúng ta thây hình dạng hướng và cường độ của mối tương quan giữa hai biến. Khi tập hợp các điểm tạo nên hình dạng hướng đi từ dưới lên theo chiều từ trái sang phải (như ở đồ thị trên), ta gọi đó là mối tương quan thuận, trong khi tương quan là nghịch khi hình dạng hướng đi từ trên xuống dưới theo chiều từ trái sang phải. Ngoài ra, ta cũng có thể biết được cường độ của mối tương quan thông qua tính hệ số tương quan r giữa hai biến số. Khi tương quan thuận, r sẽ mang giá trị dương, và ngược lại khi tương quan nghịch, Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 57
  9. r sẽ mang giá trị âm và r chạy trong khoảng từ -1 đến +1. Giá trị r càng gần +1 hoặc -1, cường độ tương quan càng lớn, r càng gần 0, cường độ tương quan càng nhỏ Hình 11. Ví dụ về Scatter Plot 2.4. Biểu thị số liệu dưới dạng bản đồ Các số liệu dịch tễ học khi biểu thị dưới dạng bản đồ cho phép có thể biết được tính chất phân bố về mặt không gian và thời gian, ứng dụng công nghệ GIS (hệ thống thông tin địa lý) là một phương tiện hữu dụng để quản lý dữ liệu không gian. Trong y tế, GIS cho phép phân tích nguyên nhân khởi phát của bệnh và khả năng lây lan của bệnh trong cộng đồng. 3. Hướng dẫn về thiết kê và sử dụng các bảng, biểu đồ và đồ thị 3.1. Lựa chọn dạng phù hợp nhất với số liệu và mục đích diễn giải Để đưa ra quyết định về việc lựa chọn hình thức trình bày số liệu phù hợp sẽ dựa trên ý tưởng về mức độ chính xác mà bạn muốn thông tin tới đối tượng. Ví dụ: lựa chọn phương pháp đồ thị đường biểu diễn liên tục sẽ phù hợp với việc so sánh xu thể; biểu đồ cột thể hiện rõ ràng sự so sánh số lượng trong một giới hạn nhất định; biểu đồ tròn có ưu điểm trong so sánh từng phần với toàn bộ; và đồ thị phân tán phù hợp khi muốn biết xu hướng và độ lớn của sự kết hợp. 3.2. Đặt ra mục đích cho mỗi phương pháp trình bày Chỉ trình bày với một mục đích hay ý tưởng: hạn chế số lượng dữ liệu và chỉ nên trình bày một loại dữ liệu trong một biểu đồ/ đồ thị (trừ khi cần so sánh). Sử dụng kiểu trình bày đền, trắng để diễn tả Do việc in màu thường là rất đắt tiền, vì vậy nên trình bày thay thế màu bằng cách dùng các gạch chéo hoặc các điểm chấm đế thế hiện cho mỗi cột khác nhau; hoặc đối với Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 58
  10. đường biểu diễn thì dùng đường liền hoặc cách đoạn và dùng điểm chấm, điểm gạch đậm, hoặc kết hợp các dạng khác nhau. 3.3. Nên chú giải chính xác và đặt đúng chỗ phù hợp Tiêu đề biểu đồ thường nêu lên “cái gì, ở đâu và khi nào” về dữ liệu cần trình bày. Tất cả các tiêu đề sẽ phải rõ ràng, sáng sủa và dễ hiếu, và cũng như tiêu đề của biếu đồ, nó phải được ghi ở ngoài vùng của dữ liệu trình bày. Chỉ có lời chú giải ngắn gọn (như lời chú giải theo từng hình “dạng khối”) có thể đặt cạnh trong vùng trình bày dữ liệu của biểu đồ. 3.4. Nêu rõ nguồn dữ liệu Số liệu có được từ đâu? Biết rõ nguồn dữ liệu sẽ giúp cho việc thẩm tra hoặc phân tích thêm của độc giả. Ngoài ra, việc tiếp cận với nguồn dữ liệu gốc có thể giúp ích cho độc giả xem xét về nội dung trích dẫn được trình bày hoặc các kết luận mà bạn đưa ra từ đó. 3.5. Rất thận trọng trong việc đưa ra các kết luận Đưa ra kết luận là phản ánh toàn bộ thông tin mà từ đó số liệu trích dẫn được nêu ra; chỉ đưa ra kết luận mà từ số liệu bạn trình bày có thể hiển thị. Tuy nhiên, luôn phải ghi nhớ rằng các bảng, biểu đồ và đồ thị mới chỉ nêu lên sự khái quát về thông tin của dữ liệu. Ghi chú giải thích làm sao nối bật rõ lên những chi tiết quan trọng mà số liệu không rõ nghĩa. Tránh các kết luận mà không cân nhắc đến sự không toàn vẹn của số liệu. TÀI LIỆU THAM KHẢO 1. Đào Văn Dũng (2020) Phương Pháp Nghiên Cứu Khoa Học-Nghiên Cứu Hệ Thống Y Tế, NXB Y học. 2. Lưu Ngọc Hoạt (2013) Phương pháp Nghiên cứu sức khỏe cộng đồng, NXB Y học. 3. Lưu Ngọc Hoạt (2017) Thống kê sinh học & Nghiên cứu Y học, NXB Y học. 4. Hoàng Văn Minh (2018) Phương pháp nghiên cứu trong bệnh viện, NXB Y học. 5. Hoàng Văn Minh, Lưu Ngọc Hoạt, Đỗ Văn Dũng, Võ Văn Thắng (2017) Khái niệm và thuật ngữ cơ bản sử dụng trong các nghiên cứu khoa học sức khỏe định lượng, NXB Y học. 6. Nguyễn Văn Tuấn (2018) Y học thực chứng, NXB Y học. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 59
  11. BÀI 5 XÁC ĐỊNH CỠ MẪU VÀ PHƯƠNG PHÁP CHỌN MẪU MỤC TIÊU 1. Phân biệt được các khái niệm về quần thể, mẫu, ý nghĩa của việc chọn mẫu đủ, đủng và đại diện trong nghiên cứu. 2. Trình bày được ưu, nhược điểm của các phương pháp chọn mẫu xác suất và không xác suất thường áp dụng trong nghiên cứu. 3. Lựa chọn và thiết kế được các phương pháp chọn mẫu thích hợp trong các trường hợp nghiên cứu cụ thể. 4. Giải thích được ý nghĩa của các thành phần trong các loại công thức tính cỡ mẫu, chọn được công thức tính cỡ mẫu thích hợp cho từng loại nghiên cứu. NỘI DUNG HỌC TẬP 1. KHÁI NIỆM VỀ MẪU VÀ QUẦN THỂ NGHIÊN CỨU 1.1. Mẫu nghiên cứu (study sample) Về lý luận, khi muốn tìm hiểu một hiện tuợng sức khỏe hoặc một mối quan hệ nhân quả nào đó trong một quần thể nhất định thì lý tưởng nhất là phải tiến hành nghiên cứu trên tất cả các cá thể sống trong quần thể đó, tức là phải làm một nghiên cứu toàn bộ (ví dụ làm điều tra dân số). Tuy nhiên, trên thực tế người ta thường không thế hoặc không cần thiết phải tiến hành các nghiên cứu toàn bộ, đặc biệt với các quần thể lớn vì một số lý do sau: + Không đủ nguồn lực, thời gian để triển khai một nghiên cứu toàn bộ. + Chất lượng điều tra, nghiên cứu có thể không tốt do thường có nhiều sai số hơn khi triển khai một nghiên cứu lớn (sự chênh lệch về trình độ, kỹ năng của điều tra viên, giám sát viên, dụng cụ, phương tiện nghiên cứu không giống nhau...). + Mặt khác, nêu nghiên cứu được làm trên một số đủ lớn các cá thể đại diện cho quần thể thì kết quả nghiên cứu vẫn cho phép có the ngoại suy cho toàn bộ quần thế đó. + Nhóm các cá thể được rút ra từ quần thể nghiên cứu để phục vụ trực tiếp cho mục đích nghiên cứu được gọi là mẫu nghiên cứu. Nghiên cứu với mẫu có thể khắc phục được một số hạn chế của nghiên cứu toàn bộ. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 60
  12. 1.2. Quần thể nghiên cứu và quần thể đích Quần thể nghiên cứu (study population) là quần thể mà từ đó mẫu được được rút ra cho nghiên cứu. Tuy nhiên mục đích của người điều tra thường không chỉ dừng lại ở quần thể nghiên cứu mà họ muốn ngoại suy, khái quát hóa ra một quần thể lớn hơn được gọi là quần thể đích (target population). Như vậy quần thể đích là quần thể mà người nghiên cứu mong muốn kết quả nghiên cứu của mình được ngoại suy ra. Cần lưu ý rằng cả quần thể nghiên cứu và đích đều được xác định bởi người nghiên cứu, chúng có chung một hiện tượng sức khỏe mà người nghiên cứu quan tâm, mặt khác chúng phải bao hàm các yếu tố về đối tượng (ai? cái gì?), không gian (ở đâu?) và thời gian (khi nào?). Trong các nghiên cứu dịch tễ học, nó sẽ là lý tưởng nếu quần thể nghiên cứu và quần thể đích là một. Tuy nhiên trong nhiều trường hợp do thiếu thông tin cho việc chọn mẫu, thiếu sự chấp nhận của cộng đồng, hoặc thiếu các nguồn lực, người điều tra phải tách ra loại quần thể đích và quần thể nghiên cứu. Ví dụ, trẻ em
  13. đồ như vậy được gọi là khung mẫu. Đây là một điều kiện quan trọng trong việc lựa chọn thiết kế mẫu thích hợp cho nghiên cứu. Trong một số trường hợp, khung mẫu không sẵn sàng cho việc chọn mẫu thì ta có thể phải chuyển đổi đơn vị chọn mẫu để phù hợp với khung mẫu sẵn có. Ví dụ khi ta muốn chọn mẫu các trẻ em dưới 5 tuổi cho một nghiên cứu về suy dinh dưỡng trẻ em, thì rất khó để có được một khung mẫu là danh sách trẻ em dưới 5 tuổi trong cộng đồng, khi đó ta có thể phải quy đổi đơn vị chọn mẫu từ trẻ em ra hộ gia đình 1.5. Phân bố mẫu (sampling distribution) Khi các mẫu có cùng kích cỡ được rút ra từ một quần thể nghiên cứu, kết quả thu được từ các mẫu cũng rất khác nhau. Sự biến thiên này được gọi là phân bố mẫu. 1.6. Tham số quần thể và tham sổ mẫu 1.6.1. Tham số quần thể (parameter) Là biểu thị một hiện tượng sức khỏe nào đó có được khi quan sát toàn bộ một quầnthể nghiên cứu. Nó luôn là một hằng số đối với mỗi một quần thể trong một thời điểm nhất định (ví dụ chiều cao trung bình của thanh niên trong tỉnh A tại thời điểm X là một hằng số). Tuy nhiên do hiếm khi tiến hành được một nghiên cứu trên toàn bộ quần thể lớn, nên tham số quần thể thường không được biết. 1.6.2. Tham số mẫu (statistic) Là biểu thị một hiện tượng sức khỏe đạt được khi quan sát một mẫu được rút ra từ một quần thể nghiên cứu. 1.6.3. Lỗi chọn mẫu (sampling error) Là sự khác biệt giữa tham số mẫu và tham số quần thể của một biến số nào đó trong một nghiên cứu. Điều này phụ thuộc rất nhiều vào cách chọn mẫu, cỡ mẫu, kỹ thuật đo lường và cả việc phân tích số liệu. 1.7. Khái niệm về suy luận thống kê Do lỗi chọn mẫu là khó có thể tránh khỏi nên khi nhiều mẫu có cùng cỡ mẫu được rút ra từ một quần thế nghiên cứu sẽ có the cho các tham số mẫu khác nhau. Các tham số mẫu này có thể là các giá trị trung bình (với biến định lượng) hoặc là các tỷ lệ (với biến định tính). Khi đó tập hợp của các tham số mẫu này sẽ cho một phân bố mẫu. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 62
  14. 1.7.1. Định nghĩa Là một quá trình khái quát hóa hoặc rút ra kết luận về một quần thể nghiên cứu dựa trên kết quả đạt được từ một mẫu. Trong trường hợp này, từ tham số mẫu ta có thể ngoại suy ra giá trị của tham số của quần thể mà từ đó mẫu được rút ra. Một nguyên tắc cơ bản trong quá trình này là cỡ của mẫu phải đủ lớn và mẫu phải đại diện cho quần thể nghiên cứu thì quá trình suy luận thống kê mới thực hiện được, vấn đề này sẽ được bàn thêm trong phần chọn mẫu. 1.7.2. Loại suy luận thông kê: có 2 loại 1.7.2.1. Ước lượng (estimation) Ước lượng là quá trình mà một tham số thu được từ một mẫu được sử dụng đế ước đoán tham số quần thế tưong ứng trong quần thế nghiên cứu. Có 2 loại ước lượng: (1) Ước lượng điểm (point estimation) Trong trường hợp này người nghiên cứu cho là tham số mẫu chính bằng với tham số quần thể. Ví dụ: tỷ lệ suy dinh dưỡng độ 3 của trẻ em tìm được từ mẫu nghiên cứu là 5%. Nếu ước lượng điểm được sử dụng tức là người nghiên cứu cho rằng tỷ lệ này trong quần thể nghiên cứu cũng là 5%. (2) Ước lượng khoảng (interval estimation) do tham số quần thể thường không được biết và do sai số chọn mẫu là khó có thể tránh khỏi, nên sẽ thiếu cơ sở để khẳng định rằng tham số mẫu bằng với tham số quần thế. Vì vậy để có một kết luận khôn Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 63
  15. ngoan hơn, người nghiên cứu đưa ra một khái niệm ước lượng khoảng, tức là tìm một khoảng mà giá trị của tham số quần thể được ựớc tính là nằm trong khoảng này với một độ tin cậy nhất định. Khoảng này bao gồm một giá trị giới hạn thấp và một giá trị cao và được tính từ giá trị của tham số mẫu tương ứng. 1.7.2.2. Kiểm định giả thuyết (hypothesis testing) Kiểm định giả thuyết là một dạng khác của suy luận thống kê. Mục đích của kiểm định giả thuyết chính là tìm các test thống kê thích hợp để tính toán giá trị p (xác suất) và thông qua p để đưa ra các kết luận thích hợp. 2. ĐẠI CƯƠNG VỀ MẪU VÀ CỠ MẪU Như đã đề cập trong phần trên, một nghiên cứu sẽ có giá trị hơn nếu tất cả các cá thể trong một quần thể được bao hàm trong nghiên cứu. Tuy nhiên, điều này thường rất khó thực hiện vì đa số các quần thể nghiên cứu thường quá lớn. Trên thực tế, một đặc trưng của quần thể có thể được ngoại suy từ kết quả thu được từ một mẫu được rút ra từ quần thể này. Sự ngoại suy này sẽ chính xác hơn nếu như mẫu nghiên cứu đại diện cho quần thể và là đủ lớn. Có 3 câu hỏi thường được đặt ra khi chọn mẫu là: (1) Quần thể nào mà từ đó mẫu sẽ được lấy ra cho nghiên cứu? (2) Làm thế nào để mẫu có thể đại diện cho quần thể nghiên cứu? (3) Mẫu bao nhiêu là đủ cho một nghiên cứu? Trả lời cho 3 câu hỏi này chính là giải quyết vấn đề xác định quần thể nghiên cứu (study population), chọn mẫu và xác định cõ’ mẫu cho một nghiên cứu. Việc xác định quần thể nghiên cứu tùy thuộc vào nhiêu vấn đề như ý tưởng của người làm nghiên cứu, vấn đề cần được nghiên cứu, các thông tin sẵn có cho việc chọn mẫu, kỹ thuật chọn mẫu, sự hiện diện của các nguồn lực phục vụ cho nghiên cứu... Quần thể nghiên cứu cần xác định rõ, phải bao hàm cả khái niệm thời gian và không gian đê phục vụ cho việc chọn mẫu. Một thiết kế mẫu được coi là tốt nếu như nó đáp ứng một số tiêu chuẩn sau: + Đại diện cho quần thể nghiên cứu: Khi nó có tất cả các tính chất cơ bản của quần thể mà từ đó nó được rút ra. + Mẫu là đủ lớn: Để có thể cho phép khái quát hóa một cách tin cậy cho quần thế nghiên cứu. + Tính thực tế và tiện lợi: Đe việc thu thập số liệu là dễ dàng và thuận tiện. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 64
  16. + Tính kinh tế và hiệu quả: Mẫu được chọn sao cho thông tin thu được là nhiều nhất trong khi chi phí là thấp nhất. 3. CHỌN MẪU Có hai nhóm kỹ thuật chọn mẫu đó là chọn mẫu xác suất (probability sampling) và không xác suất (nonprobability sampling). Mẫu được chọn theo kỹ thuật xác suất có tính đại diện cho quần thể hơn. 3.1. Kỹ thuật chọn mẫu xác suất Mỗi một cá thể trong quần thể có một cơ hội biết trước để chọn vào mẫu. Kỹ thuật này chỉ thực hiện được khi biết khung mẫu của quần thể nghiên cứu. 3.1.1. Mẫu ngẫu nhiên đơn (simple random sampling) Là mẫu mà tất cả các cá thể trong quần thể có cùng cơ hội (cùng xác suất) để được chọn vào mẫu. Ví dụ: Chọn 500 hồ sơ trong số 5000 sản phụ đã đẻ tại bệnh viện A trong năm 2005 để nghiên cứu. Nếu theo cách chọn ngẫu nhiên đơn thì mỗi sản phụ có xác suất là 10% được chọn vào mẫu. Ta có thể tiến hành như sau:Lập một khung chọn mẫu chứa đụng tất cả các đơn vị mẫu. Sử dụng một quá trình ngẫu nhiên để chọn các cá thể vào mẫu. Có nhiều cách để chọn một mẫu ngẫu nhiên đơn từ quần thể như: Tung đồng xu, tung súc sắc, bốc thăm, sử dụng bảng số ngẫu nhiên... Ưu điểm: + Cách làm đơn giản, tính ngẫu nhiên và tính đại diện cao; + Là kỹ thuật chọn mẫu xác suất cơ bản và có thể lồng vào tất cả các kỹ thuật chọn mẫu xác suất cơ bản và có thể được lồng vào tất cả các kỹ thuật chọn mẫu xác suất phức tạp khác. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 65
  17. Nhược điểm: + Cần phải có một danh sách của các đơn vị mẫu để phục vụ cho chọn mẫu. Điều này thường không thể có được với một mẫu lớn hoặc mẫu dao động; + Các cá thể được chọn vào mẫu có thể phân bố tản mạn trong quần thể, do vậy việc thu thập số liệu sẽ tốn kém và mất thời gian. 3.1.2. Mẫu hệ thống (systematic sampling) Trong mẫu hệ thống, mỗi cá thể trong một danh sách được chọn bằng cách áp dụng một khoảng hằng định theo sau bởi một sự bắt đầu ngẫu nhiên. Các bước: + Tất cả các đon vị mẫu (sampling unit) trong quần thể định nghiên cứu được ghi vào một danh sách hoặc trình bày trên bản đồ (khung chọn mẫu). + Xác định khoảng mẫu k = N/n (N: số cá thể trong quần thể, n cỡ mẫu định chọn). + Một số ngẫu nhiên (i) giữa 1 và k được chọn bằng cách chọn ngẫu nhiên đơn. + Các cá thể có số thứ tự i + 1k ; i + 2k; i + 3k.... sẽ được chọn vào mẫu cho đến khi kết thúc danh sách hoặc bản đồ. Số ngẫu nhiên được chọn giữa 1 và k. Ưu điểm: + Nhanh và dễ áp dụng; + Nếu danh sách cá thể của quần thể được xếp ngẫu nhiên, chọn mẫu hệ thống tương tự như chọn ngẫu nhiên đơn; + Nếu danh sách cá thể được xếp theo thứ tự tầng, đây là cách lựa chọn tương tự như mẫu tầng có tỷ lệ (proportionate stratified sample) tức là tầng có cỡ lớn hơn sẽ có nhiều cá thể được chọn vào mẫu hơn; Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 66
  18. + Trong một số trường hợp, mặc dù khung mẫu không có hoặc không biết tổng số cá thể trong quần thể, nhưng chọn mẫu hệ thống vẫn có thế đựoc áp dụng bằng cách xác định một quy luật phù hợp trước khi tiến hành chọn mẫu. Ví dụ, để có thể thu thập được số liệu về sẹo lao ở trẻ em trong một cộng đồng nông thôn không biết danh sách các hộ gia đình, người nghiên cứu có thể xác định một quy luật chọn mẫu trước thu thập số liệu như sau: Hộ gia đình đầu tiên được điều tra là hộ thứ nhất nằm bên trái của UBND xã. Các hộ tiếp theo sẽ được chọn bằng cách người nghiên cứu tiếp tục đi về bên trái và cứ cách 7 gia đình lại điều tra một gia đình (khoảng cách các hộ gia đình được chọn vào nghiên cứu có thế được chọn bằng cách lấy tổng số hộ gia đình trong cộng đồng chia cho số hộ gia đình dự kiến điều tra). Nếu gặp lối rẽ thì người nghiên cứu chỉ được rẽ trái. Tất cả các trẻ em trong các hộ gia đình được chọn đều được kiểm tra sẹo lao cho đến khi có đủ so trẻ cần được điều tra. Số hộ gia đình cần điều tra có thể được ước đoán từ số trẻ em trung bình trong một gia đình ở cộng đồng và số trẻ cần nghiên cứu (cỡ mẫu). Trong một số trường hợp khác, các cá thể trong quần thể nghiên cứu có thể không cần lên danh sách để chọn, người nghiên cứu có thể đưa ra một quy luật trước khi chọn mẫu như sau: tất cả các bệnh nhân đến phòng khám vào ngày thứ năm trong tuần sẽ được tham gia vào nghiên cứu. Hoặc nệnh nhân đến khám ngày lẻ sẽ vào nhóm 1, đến ngày chẵn sẽ vào nhóm 2 để phục vụ cho một thử nghiệm nào đó. Hoặc các cá thể trong mẫu được chọn cho một nghiên cứu đứng vòng tròn, sau đó đếm lần lượt 1,2,3; 1,2,3... cho đến hết, người đếm số 1 đầu tiên phải được chọn ngẫu nhiên. Các cá thế đếm số 1 sẽ vào nhóm 1, số 2 vào nhóm 2, số 3 vào nhóm 3, như vậy ta đã có 3 nhóm ngẫu nhiên cho một thử nghiệm. Nhược điểm: Khi việc sắp xếp khung mẫu có một quy luật nào đó tình cờ trùng với khoảng chọn mẫu hệ thống, các cá thể trong mẫu có thể thiếu tính đại diện. Ví dụ: một cộng đồng được hình thành bởi nhiều dãy nhà, trong đó mỗi nhà đều có 10 gia đình. Nếu tình cờ hệ số k trong chọn mẫu hệ thống cũng bằng 10 và hộ gia đình đầu tiên được chọn vào mẫu là gia đình nằm ở đầu một dãy nhà thì tất cả các gia đình trong mẫu sẽ đều là các gia đình ở đầu các dãy nhà. Như vậy mẫu sẽ thiếu tính đại diện về phân bố không gian. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 67
  19. 3.1.3. Mẫu ngẫu nhiên phân tầng (stratified random sampling) Là mẫu đạt được bởi việc phân chia các cá thể của quần thể nghiên cứu thành các nhóm riêng rẽ được gọi là tầng và cách chọn mẫu ngẫu nhiên đơn sẽ được sử dụng trong mỗi tầng. Các bước: + Phân chia quần thể nghiên cứu thành các tầng khác nhau dựa vào một hoặc vài đặc điểm nào đó như nhóm tuổi, giới, tầng lớp xã hội, dân tộc... Giữa các tầng không có sự chồng chéo. + Thực hiện việc chọn mẫu ngẫu nhiên đơn trong từng tầng. Các phân tích thống kê (như giá trị trung bình, độ lệch) được tính toán riêng cho mỗi tầng sau đó sẽ kết hợp lại trên cơ sở kích cỡ của từng tầng (cân bằng trọng: weighted) để cho kết quả của toàn bộ quần thể. Ví dụ trong nghiên cứu tại các Bệnh viện của một khu vực, nếu số lượng các nhóm bệnh viện không bằng nhau, ta có thể chia làm các tầng như sau: Ưu điểm: + Tạo ra trong mỗi tầng có một sự đồng nhất về yếu tố được chọn để phân tầng, do đó sẽ giảm sự chênh lệch giữa các cá thể; + Quá trình thu thập số liệu thường dễ hơn so với mẫu ngẫu nhiên đơn; + Khi nguyên tắc mẫu tỷ lệ được sử dụng, tầng có kích cỡ lớn hơn sẽ có nhiều cá thể được chọn vào mẫu hơn. + Nguyên tắc mẫu không tỷ lệ cũng có thể được áp dụng trong mẫu tầng, khi đó tỷ lệ mẫu trong các tầng sẽ khác nhau, với những tầng có biến thiên lớn giữa các cá thể hoặc chi phí cho chọn mẫu thấp, người ta thường áp dụng tỷ lệ mẫu lớn, cách này giúp cho người điều tra có đủ số cá thể trong mỗi tầng để có thể phân tích được. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 68
  20. + Mẫu chọn từ mỗi tầng có tính đại diện và khái quát hóa cao cho tầng đó. + Nếu yếu tố được chọn để phân tầng có tính đồng nhất cao trong mỗi tầng, nhưng lại thấp giữa các tầng thì kết quả nghiên cứu sẽ có độ chính xác cao hơn là mẫu chọn theo cách ngẫu nhiên đơn (2 cách phải có cùng với cỡ mẫu). Nhược điểm: Cũng như chọn mẫu ngẫu nhiên đơn, danh sách tất cả các cá thể trong mỗi tầng phải được hệt kê và được gắn số ngẫu nhiên. Điều này thường khó thực hiện trong thực tế. 3.1.4. Mẫu chùm (cluster sampling) Hay còn gọi là mẫu cụm, là mẫu đạt được bởi việc lựa chọn ngẫu nhiên các nhóm cá thể được gọi là chùm từ nhiều chùm trong một quần thể nghiên cứu. Trong trường hợp này đơn vị mẫu là các chùm chứ không phải là các cá thế. Các bước: + Xác định các chùm thích hợp: Việc này thường được làm bởi người điều tra. Chùm được làm bởi tập hợp các cá thế gần nhau (làng, xã, trường học, khoa phòng, bệnh viện...) do đó thường có chung một số đặc diem. Các chùm thường không có cùng kích cỡ. + Lập danh sách tất cả các chùm, chọn ngẫu nhiên một số chùm vào mẫu. Từ đây sẽ có 2 cách chọn tiếp tùy theo ý tưởng của người nghiên cứu: Cách 1: Tất cả các cá thế trong các chùm đã chọn sẽ được bao gồm vào nghiên cứu. Trong cách này đơn vị mẫu (sampling unit) chính là các chùm được chọn, trong khi yếu tố quan sát (observation element) lại là các cá thể trong chùm (ví dụ, các hộ gia đình trong thôn được chọn, trẻ em trong các hộ gia đình được chọn...). Cách này được gọi là mẫu chùm một bậc và xác suất của một chùm được chọn vào mẫu bằng số chùm dự kiến chọn chia cho tổng số các chùm. Cách 2: Liệt kê danh sách các cá thể trong các chùm đã chọn, sau đó áp dụng cách chọn mẫu ngẫu nhiên đon hoặc ngẫu nhiên hệ thống trong mỗi chùm đế chọn các cá thế vào mẫu. Trong trường hợp này đơn vị mẫu và đơn vị quan sát là trùng nhau (mẫu 2 bậc). Ưu điểm: + Nó thường được áp dụng trong các nghiên cứu điều tra trong một phạm vi rộng lớn, độ phân tán cao, danh sách của tất cả các cá thể trong quần thể không thể có được (do khó hoặc đắt), trong khi chỉ có danh sách hoặc bản đồ các chùm. Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học. Chủ biên: Lưu Ngọc Hoạt (2017) 69
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
13=>1