intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Phương pháp nghiên cứu khoa học - Bài 15: Cách tính cỡ mẫu

Chia sẻ: Nguyễn Bình Minh | Ngày: | Loại File: DOC | Số trang:7

132
lượt xem
10
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng "Phương pháp nghiên cứu khoa học - Bài 15: Cách tính cỡ mẫu" giúp người học có thể hiểu được hai cách tiếp cận trong cách tính cỡ mẫu, bao gồm khái niệm về năng lực nghiên cứu, biết được những yếu tố nào ảnh hưởng đến việc tính toán cỡ mẫu và ảnh hưởng như thế nào,... Mời các bạn cùng tham khảo.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Phương pháp nghiên cứu khoa học - Bài 15: Cách tính cỡ mẫu

  1. Cách tính cỡ mẫu Mục tiêu Sau khi nghiên cứu bài này, hội thảo viên có khả năng: (i) Hiểu được hai cách tiếp cận trong cách tính cỡ  mẫu, bao gồm khái niệm về  năng   lực nghiên cứu (ii) Biết được những yếu tố nào ảnh hưởng đến việc tính toán cỡ mẫu và ảnh hưởng  như thế nào (iiI) Biết được cách tính cỡ mẫu cho những tình huống khác nhau (iv) Biết được ảnh hưởng của cỡ mẫu lên những khía cạnh thiết kế khác. (v) Ðánh giá được những vấn đề khác của cỡ mẫu Giới thiệu Cỡ  mẫu sẽ  có  ảnh hưởng lớn đến độ  chính xác của  ước lượng thống kê. Từ  định lí   giới hạn trung tâm chúng ta hi vọng rằng con số  trung bình được  ước lượng từ  một   mẫu sẽ tập trung tại trung bình của dân số đó. Tuy vậy chúng ta cũng biết rằng con số  ước lượng sẽ không chính xác bằng trung bình của dân số đó mà mức độ phân tán phụ  thuộc vào cỡ mẫu: Nếu cỡ mẫu nhỏ  độ phân tán lớn, nếu cỡ mấu lớn thì độ phân tán   nhỏ  và ta hi vọng số trung bình của mẫu sẽ bằng trung bình của dân số. Người ta có   thể  trình bày mức độ  phân tán theo khoảng tin cậy 95%. Nếu độ    phân tán lớn thì  khoảng tin cậy 95% sẽ rộng và  chúng ta khó lòng thực sự  biết được trung bình của   dân số sẽ nằm  ở đâu trong khoảng này. Nói rộng ra, nếu cỡ mẫu nhỏ chúng ta không   thể  ước lượng một cách chính xác, chúng ta không thể chứng minh sự khác biệt giữa   hai nhóm là không có ý nghĩa. Vấn đề xác định cỡ mẫu trong nghiên cứu khoa học  là một vấn đề  quan trọng. Nếu   chúng ta lấy mẫu quá nhỏ, đến giai đoạn phân tích ta có thể thấy  được điều đó qua sự  không chính xác của uớc lượng, sự thất bại trong chứng minh giả thuyết. Tuy vậy khi   chúng ta đã đi vào giai đoạn phân tích số liệu thì lúc đó là  quá chậm trễ để có thể thay   đổi được cỡ  mẫu. Ngược lại nếu chúng ta lấy một cỡ  mẫu quá lớn thì chúng ta  rõ   ràng lãng phì tiền bạc và thời gian. Hai cách tiếp cận trong tính cỡ mẫu Trên cơ bản có hai cách tiếp cận trong tính cỡ mẫu: (a) dựa tên sự ước lượng của một tỉ lệ, một trung bình, hiệu số, nguy cơ tương   đối   với một mức độ chính xác nhất định. Thí dụ, để  ước lượng tỉ  leẹ  trẻ  em  trong  lứa từ 12­23 tháng tuổi được tiêm chủng đầy đủ (với độ chính xác) trong  vòng 10%.  Câu hỏi chìa khóa của cách tiếp cận này là khoảng tin cậy sẽ là bao  nhiêu? (b) Dựa trên kiểm định giả  thuyết. Thí dụ,so sánh thời gian bú sữa mẹ  hoàn   toàn  ở  2 nhóm có giáo dục sức khỏe và nhóm chứng.Câu hỏi chìa khóa trong   cách tiếp cận này là xác suất kết luận sai lầm trong kiểm định giả  thuyết là  
  2. bao nhiêu? Ước lượng một hậu quả với một độ chính xác nhất định Ðộ chính xác của một  ước lượng (với khoảng tin cậy 95%) = d có nghĩa là sai số  tối   đa của ước lượng là d (với độ tin cậy 95% hay xác suất điều trên không bị sai là 95%) Công thức tính cỡ mẫu để ước lượng khoảng tin cậy (1­ α) của một tỉ lệ p  với sai số  d là như sau: z12 p (1 p ) /2 n d2 Một thắc mắc hay nẩy sinh trong khi nghiên cứu công thức này là trong khi chúng ta   muốn nghiên cứu ước lượng p nhưng trong khi tính toán để tính cỡ mẫu chúng ta phải  có giá trị của tỉ lệ p! Toàn bộ  logic của vấn đề  là ở  chỗ  chúng ta có thể  ước lượng p   trước lúc nghiên cứu một cách không chính xác, sau nghiên cứu chúng ta có thể   ước   lượng p một cách chính xác hơn nhiều. Ta có thể ước lượng p sử dụng phán đoán của  chúng ta, sử  dụng những nghiên cứu   trước  đó, có thể  tiến hành nghiên cứu dẫn  đường. Trong trường hợp chúng ta không thể   ước đoán p, ta có thể  ước đoán p =0,5,  một ước đoán an toàn nhất và sẽ cho một cỡ mẫu an toàn nhất (lớn nhất). Không có quy tắc cứng nhắc độ  chính xác d, điều này phụ  thuộc vào mục đích của   nghiên cứu và vào tài nguyên hiện có. Lưu ý: ­ Công thức được trình bày là dành cho phép lấy mẫu ngẫu nhiên đơn. Nếu nghiên cứu   sử dụng phương pháp lấy mẫu cụm cần phải hiệu chỉnh tác động làm giảm độ  chính  xác của việc chọn cụm bằng cách tăng cỡ  mẫu. Cỡ  mẫu trong nghiên cứu lấy mẫu   cụm thường được nhân lên với một hệ số (được gọi là hệ số  thiết kế) có giá trị  từ  2   đến 4. Hệ  số  thiết kế  có thể  tính được từ  việc nghiên cứu thử. Nếu không có điều   kiện tính hệ số thiết kế có thể chọn hệ số thiết kế là 3. ­  Công thức tính cỡ mẫu trên là dành lấy mẫu từ một dân số vô hạn hay khá lớn. Nếu   cỡ  mẫu vào khoảng từ  10% dân số  trở  lên, ta có thể  điều chỉnh để  có cỡ  mẫu nhỏ  hơn. N P N hc N P Với N là cỡ mẫu chưa hiệu chỉnh, P là kích thước của dân số đích và Nhc là cỡ  mẫu sau khi đã hiệu chỉnh. ­ Chúng ta cũng nên phải trù liệu cho những số liệu bị mất, những trường hợp từ chối   nghiên cứư bằng cách tăng cỡ mẫu. Kiểm định một giả thuyết, so sánh 2 nhóm Giả sử chúng ta muốn so sánh hai tỉ lệ (thí dụ tỉ  lệ  trẻ em được bú sữa non trong hai   nhóm bà mẹ: một nhóm được giáo dục sức khỏe và một nhóm không). Chúng ta có thể  kiểm định xem hai tỉ lệnày  có khác nhau đáng kể hay không, nói cách khác kiểm định   xem hiệu số của hai tỉ lệ này có khác một cách có ý nghĩa với zero khay không. Sau khi  tiến hành phân tích chúng ta có thể  bác bỏ  hay không bác bỏ  giả  thuyết này. Về 
  3. phương diện thống kê, dù khi chúng ta bác bỏ  hay không bác bỏ, chúng ta đều có khả  năng bị sai lầm: sai lầm mà chúng ta mắc phải khi bác bỏ  giả  thuyết được gọi là sai   lầm loại I, sai lầm chúng ta  mắc phải khi không bác bỏ được gọi là sai lầm loại II. Khi kiểm định H0: Không có sự khác biệt (p1=p2; OR=1 ; RR=1 ; β=0) Chân lí là Ho đúng Chân lí là Ha đúng (Không có sự khác biệt) (Không có sự khác biệt) Bác bỏ giả thuyết H0 Sai   lầm   loại   1 Kết   luận   đúng (Xác suất = α) (Xác   suất   =   1­β  = Power của nghiên cứu) Không bác bỏ giả thuyết H0 Kết   luận   đúng Sai   lầm   loại   II (Xác suất = 1­α) (Xác suất = β) Lí tưởng, chúng ta muốn giảm thiểu cả hai loại sai lầm trong nghiên cứu. Lưu ý rằng   chúng ta đã định nghĩa cái gọi là  năng lực (power) của nghiên cứu=1­sai lầm loại II.   Năng lực là xác suất đạt được kết quả  có ý nghĩa thống kê nếu thực sự  có sự  khác  biệt giữa p1 và p2. Mục tiêu của chúng ta khi chọn cỡ mẫu là nếu có sự  khác biệt về  lâm sàng quan trọng giữa hai nhóm, chúng ta có cơ hội tốt để tìm  thấy sự khác biệt có   ý nghĩa thống kê trong 2 nhóm. Ðiều này là một ý niệm hết sức quan trọng trong thiết  kế nghiên cứu và lí giải. Nếu trong giai đoạn phân tích nếu kết quả là có ý nghĩa thống  kê, thì hầu hết mọi người đều thỏa mãn. Mặt khác nếu kết quả  không có ý nghĩa  thông kê thì điều này có thể xảy ra do (a) không có sự khác biệt thực sự giữa hai nhóm   và (b) có sự  khác biệt nhưng mẫu của chúng ta không cho thấy sự  khác biệt bởi vì   năng lực của mẫu thấp (cỡ mẫu nhỏ) do đó chúng ta không có kết luận rõ ràng. Do đó,   nếu chúng ta  chọn mẫu để có năng lực cao và kết quả  không có ý nghĩa thống kê thì   chúng ta có thể chắc hơn về sự khác biệt. Ðể chọn cỡ mẫu (trong trường hợp cỡ mẫu của 2 nhóm so sánh bằng nhau), chúng ta  phải có 4 tham số ­ Sai lầm loại I hay còn gọi là mức ý nghĩa mà chúng ta muốn có trong nghiên cứu   (thường là 5%) ­ Sai lầm loại II chúng ta muốn có trong nghiên cứu (Sai lầm loại hai khoảng 10­20%  tương ứng với năng lực từ 80­90%) ­ Tỉ  lệ  trong một nhóm cơ  bản (thí dụ  tỉ  lệ  tiếp xúc với yếu tố  nguy cơ  trong nhóm   chứng của một nghiên cứu bệnh chứng) ­ Tỉ lệ trong một nhóm khác (thí dụ tỉ lệ tiếp xúc với yếu tố nguy cơ trong nhóm bệnh   của một nghiên cứu bệnh chứng).  Đôi khi chúng ta không trình bày tỉ lệ của nhóm này   một cách cụ thể mà trình bày nguy cơ tương đối hay tỉ số số chênh mà chúng ta mong   muốn phát hiện trong một nghiên cứu đoàn hệ hay nghiên cứu bệnh chứng. Công thức tính cỡ mẫu (cho mỗi nhóm)  để so sánh hai tỉ lệ π1 và π2 của hai nhóm: {z1 1 (1 1 ) 2 (1 2 ) z1 /2 2 (1 )}2 n ( 1 2 )2
  4. Các điểm cần lưu ý trong tính cỡ mẫu ­ Như đã nói ở trên, cách tính cỡ mẫu chỉ cho chúng ta một ước lượng thô của cõ mẫu  cần thiết bởi vì nó dựa trên sự ước đoán về giá trị của thông số, quyết định chủ  quan   của chúng ta về  hậu quả  mà chúng ta muốn phát hiện và công thức được sử  dụng là  công thức gần đúng. Do đó con số  tính ra giúp chúng ta phân biệt giữa cỡ  mẫu 50 và  100 chứ không phân biệt cỡ mẫu 50 và 53. ­ Chúng ta phải  cân đối  giữa điều chúng ta mong muốn và tính khả thi. Ðôi khi có thể  dùng công thức tính cỡ  mẫu để  đi ngược lại năng lực của nghiên cứu. Thí dụ  nếu  chúng ta có một kinh phí hạn chế  để  thực hiện một  nghiên cứu nên  chỉ  có một cỡ  mẫu nhất định. Chúng ta có thể tính ngược lại từ cỡ mẫu để biết năng lực của nghiên   cứu. Nếu hóa ra năng lực của nghiên cứu rất thấp (thí dụ như  20%) tốt nhất chung ta   không nên tiến hành nghiên cứu vì chúng ta   đã nắm chắc kết quả thất bại. ­ Nếu một nghiên cứu có nhiều mục tiêu thì cỡ  mẫu đủ  cho một mục tiêu này có thể  không đủ  cho mục tiêu khác. Ðể  tính cỡ  mẫu, tốt nhất phải chú trọng vào biến số  (hoặc những biến số quan trọng nhất). ­ Tính cỡ mẫu không khó, cái khó là  phải cung cấp những giả định của nghiên cứu: sai   lầm loại một, năng lực, sự khác biệt mà chúng ta muốn phát hiện. Tính cỡ mẫu bằng phần mềm Epi Info: Ðầu tiên ta vào phần mềm Epitable bằng 1 trong 2 cách (giả sử thư mục chứa Epi Info   trong là c:\epi6) ­ Vào trực tiếp: c:\>c:\epi6\epitable  ­ Thông qua trình đơn chính của epi6 c:\>c:\epi6\epi6  Khi đã vào trình đơn chính của Epi6 chọn program Epitable trong trình đơn Programs   bằng cách dùng chuột hoặc nhấn Alt­P rồi kéo con trỏ  xuống EPITABLE Calculator  rồi nhấn 
  5. _ Describe Compare Study Sample Probability Setup _____________________________ +----------------------+ _________________________ _____________________________ ¦ Sample size > ¦ _________________________ _____________________________ ¦ Power calculation > ¦ _________________________ _____________________________ ¦ Random number table ¦ _________________________ _____________________________ ¦ Random number list ¦ _________________________ _________+------------------- +----------------------+ -------------+___________ _________¦ ¦___________ _________¦ _____¦ _¦ _¦ __¦ __¦ ¦___________ _________¦ _¦ _¦ _¦ _¦ ¦___________ _________¦ _¦ _¦___¦ __¦ ____¦ ___¦ _¦ _¦ ___¦ ¦___________ _________¦ ___¦ _¦ _¦ _¦ _¦ _¦ ____¦ _¦ _¦ _¦ ¦___________ _________¦ _¦ _¦ _¦ _¦ _¦ ____¦ _¦ _¦ _¦ _____¦ ¦___________ _________¦ _¦ ____¦ _¦ _¦_¦ _¦ _¦ _¦ _¦ _¦ _¦ ¦___________ _________¦ _____¦ _¦ ___¦ _¦ ___¦_¦ _¦___¦ ___¦ ___¦ ¦___________ _________¦ ___¦ ¦___________ _________¦ ¦___________ _________+----------------------------------------------------------+___________ ________________________________________________________________________________ ________________________________________________________________________________ ____________________________________________________________________¦¦__________ ___________________________________________________________________¦¦¦¦_________ __________________________________________________________________¦¦¦¦¦¦________ _________________________________________________________________¦¦¦¦¦¦¦¦_______ F1-Help F3-Move F4-Zoom F5-Print F6-Next F9-_ F10-Quit Mem:228552 Sau đó chọn Samle size bằng cách dùng chuột hay nhấn Alt­S rồi di chuyển con trỏ  vào sample size rổi nhấn . Chương trình Epi Info cho phép tính cỡ mẫu trong 4 trường hợp: Ước lượng một tỉ lệ  (single proportion); So sánh 2 tỉ lệ trong hai nhóm (Two proportions); Nghiên cứu đoàn  hệ (cohort study) và nghiên cứu bệnh chứng (Case­control study). Chọn loại thích hợp  bằng cách di chuyển trỏ rồi nhấn . Khi đó màn hình sẽ hiện lên một cửa số có   nhiều trường. Trong cửa số  này chúng ta có thể  di chuyển con trỏ  giữa các trường   bằng cách nhấn phím  hoặc phím . Nhập các giả  định cần thiết   vào các trường thích hợp. Di chuyển con trỏ đến ô Calculate, nhấn  để xem kết  quả tính toán. Lưu ý: Trong cách tính cỡ  mẫu  ước lượng một tỉ  lệ, chúng ta thấy có một tham số  Design effect. Tham số dùng để điều chỉnh nếu chúng ta lấy mẫu theo cụm. Do đó nếu   ta lấy mẫu ngẫu nhiên đơn thì Design effect=1. Nếu chúng ta lấy mẫu theo cụm thì   tham số này sẽ lớn hơn 1 và độ lớn cụ thể thì phụ thuộc vào mức độ không đồng nhất   giữa các cụm. Nếu chúng ta lấy mẫu theo cụm thì chọn Design effect là bao nhiêu? Thông thường  chúng ta có thể tham khảo các nghiên cứu trước hoặc làm nghiên cứu pilot để xác định  mức độ không đồng nhất. Nếu chúng ta có kinh nghiệm chúng ta có thể dùng trực giác  để  phán đoán design effect. Nếu chúng ta không có kinh nghiệm, không tìm được tài  liệu tham khảo và không thể tiến hành nghiên cứu pilot, chúng ta chọn Design effect =  2 để có cỡ mẫu đảm bảo an toàn (Design effect hiếm khi nào lớn hơn 2).
  6. Thí dụ Thí dụ 1: Cho một nghiên cứu bệnh chứng, sử dụng những giả định sau để  tính  cỡ mẫu cho từng trường hợp Năng lực của nghiên cứu = 90%;  mức ý nghĩa = 5%; 1 bệnh cho một chứng % chứng tiếp xúc với yếu tố nguy cơ OR 5% 20% 50% 70% 90% 1.5 2346 2 244 5 46 10 50 1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu bệnh   chứng và khi nào không. 2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa   =5% OR= 2 và tỉ  lệ  tiếp xúc với yếu tố  nguy cơ  là 30%. Hãy tính cỡ  mẫu khi có 1   chứng: 1 bệnh; 2 chứng: 1 bệnh; 3 chứng: 1 bệnh. Thí dụ 2: Cho một nghiên cứu đoàn hệ, sử dụng những giả định sau để  tính cỡ  mẫu cho từng trường hợp Năng lực của nghiên cứu = 90%;  mức ý nghĩa = 5%; nhóm có tiếp xúc= nhóm không  tiếp xúc tỉ suất mắc bệnh trong nhóm không tiếp xúc với yếu tố nguy cơ RR 0,1% 1% 5% 15% 30% 1.5 108,904 2 3300 3 207 5 15 1. Dựa trên phép tính cỡ mẫu hãy đưa ra khuyến cáo khi nào nên dùng nghiên cứu đoàn  hệ và khi nào không. 2. Hãy tính cỡ mẫu trong một nghiên cứu bệnh chứng có năng lực =90%, mức ý nghĩa   =5% OR= 2 và tỉ suất mắc bệnh là 5%. Hãy tính cỡ mẫu khi có nhóm không tiếp xúc =   nhóm tiếp xúc; nhóm không tiếp xúc = 2 nhóm tiếp xúc; nhóm không tiếp xúc = 3  nhóm tiếp xúc Thí dụ  3: Phòng y tế  huyện A. muốn kiểm tra báo cáo về  tỉ  lệ  tiêm chủng của  
  7. một xã là 80% bằng cách tiến hành một cuộc điều tra (với sai số tuyệt đối dưới 5%,  độ  tin cậy = 95%). Nếu phòng y tế  quyết định chọn mẫu bằng phương pháp chọn  mẫu ngẫu nhiên thì cỡ  mẫu cần thiết là bao nhiêu? Nếu chọn theo cụm thì cỡ  mẫu  cần thiết là bao nhiêu?
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2