intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng Quản lý chất lượng số liệu - Hoàng Thị Hải Vân

Chia sẻ: Sung Sung | Ngày: | Loại File: PDF | Số trang:26

113
lượt xem
4
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng Quản lý chất lượng số liệu được biên soạn nhằm giúp các bạn phân biệt được sai số ngẫu nhiên và sai số hệ thống; liệt kê được các nguồn sai số trong một số thiết kế nghiên cứu cơ bản; liệt kê được các phương pháp hạn chế sai số; liệt kê được các tiêu chuẩn của một yếu tố nhiễu và phương pháp kiểm soát yếu tố nhiễu; phân biệt được yếu tố nhiễu và yếu tố tác động tương hỗ và phương pháp xác định.

Chủ đề:
Lưu

Nội dung Text: Bài giảng Quản lý chất lượng số liệu - Hoàng Thị Hải Vân

  1. Hoàng Thị Hải Vân Bộ môn TKTH Viện Đào tạo YHDP&YTCC 0912693335 – hoangthihaivan@hmu.edu.vn Mục tiêu: 1. Phân biệt được sai số ngẫu nhiên và sai số hệ thống 2. Liệt kê được các nguồn sai số trong một số thiết kế nghiên cứu cơ bản 3. Liệt kê được các phương pháp hạn chế sai số 4. Liệt kê được các tiêu chuẩn của một yếu tố nhiễu và phương pháp kiểm soát yếu tố nhiễu 5. Phân biệt được yếu tố nhiễu và yếu tố tác động tương hỗ và phương pháp xác định 1
  2. Các nội dung chính  Tính giá trị của nghiên cứu  Sai số lựa chọn (sai số hệ thống) và phương pháp hạn chế sai số  Yếu tố nhiễu  Cách xác định yếu tố nhiễu và yếu tố tác động tương hỗ  Các phương pháp khống chế nhiễu Tính giá trị của nghiên cứu  Kết quả của nghiên cứu có phản ánh đúng “sự thật” sau khi đã xen xét các điểm mạnh, điểm yếu của thiết kế nghiên cứu và phương pháp áp dụng trong nghiên cứu hay không?  Giá trị nội suy (internal validity)  Giá trị ngoại suy (external validity)  Các lỗi thường gặp trong nghiên cứu là:  Chọn mẫu, phân bổ mẫu, nhớ lại  Các đo lường, đầu ra và các yếu tố liên quan  Yếu tố nhiễu 2
  3. Giá trị nội suy (internal validity)  “Mối liên hệ giữa yếu tố nguy cơ và vấn đề sức khỏe được nghiên cứu có thể được quy cho là do yếu tố nguy cơ đó qua kết quả của NC này được không?  Có đúng là các kết quả thu được phán ánh đúng bản chất của quần thể nghiên cứu hay không?  Nhóm NC đã được lựa chọn đúng hay chưa?  Lỗi lựa chọn  Có xảy ra sai lầm nào trong quá trình đo lường yếu tố nguy cơ và vấn đề sức khỏe hay không?  Lỗi đo lường  Có yếu tố nào tác động đến mối liên hệ giữa yếu tố nguy cơ và vấn đề sức khỏe được nghiên cứu hay không?  Yếu tố nhiễu Giá trị ngoại suy (external validity)  Kết quả nghiên cứu có thể khái quát hóa từ nhóm nghiên cứu ra quần thể đích hay không? Có thể khía quát hóa cho các quần thể khác ngoài nhóm NC không?  Có thể ngoại suy được không?  Cần quan tâm chú ý:  Các sai lầm và các sai số (internal validity)  Các đặc điểm của quần thể nghiên cứu so với quần thể đích và các quần thể khác ngoài nhóm NC  Giới, tuổi, các vấn đề khác …. 3
  4. Tin cậy và giá trị (Reliability and validity) Các sai lầm thường gặp trong nghiên cứu và các loại sai số  Các NC dịch tễ học cung cấp bằng chứng cho việc ra các chính sách và thực hành trong lĩnh vực y tế  Mục tiêu của các nghiên cứu là hạn chế đến mức thấp nhất các sai số có thể xảy ra  Không một nghiên cứu nào không có sai số, do đó:  Cần xác định nguồn sai số để đánh giá tính giá trị của NC  Cần xác định và hạn chế sai số trong tất cả các bước thiết kế nghiên cứu 4
  5. Nguyên nhân dẫn đến NC không có tính giá trị - Các loại sai số  Sai số ngẫu nhiên:  Sai số do chọn mẫu (random sampling errors)  Sai số đo lường (random measurement variability)  Sai số hệ thống:  Sai số chọn (selection bias)  Sai số đo lường (mesuarment errors)  Nhiễu Nguyên nhân sai lầm và nguồn gốc các sai số Quần thể đích Sai lầm trong lựa chọn quần thể Quần thể nguồn - Sai lầm trong chọn mẫu (SS ngẫu nhiên - Sai số chọn (SS hệ thống) Quần thể nghiên cứu - Sai số chọn (từ chối tham gia, không theo dõi được) Mẫu nghiên cứu - Sai số đo lường Các nhóm so sánh - Nhiễu 5
  6. Sai số ngẫu nhiên  Giá trị của một quan sát trên một mẫu nghiên cứu bị sai lệch đi so giá trị thật của quần thể hoàn toàn do ngẫu nhiên, may rủi dẫn đến sự thiếu chính xác trong mô tả thông số của quần thể và trong việc đo lường sự kết hợp  Không thể khống chế được bằng các kỹ thuật thu thập số liệu  Nguyên nhân:  Do may rủi  Do biến đổi sinh học của đối tượng nghiên cứu ðiể ði ểm thi Sinh viên số 1 2 3 4 5 6 7 8 9 Điểm đạt được 9 8 7 9 6 4 5 8 3 Nếu coi 9 sinh viên này là 1 quần thể  Chọn ngẫu nhiên mẫu có 2 SV, ta sẽ có 36 cơ hội. 6
  7. STT CÆp sinh §iÓm cña tõng §iÓm trung b×nh viªn sè: sinh viªn cña 2 sinh viªn 1 1, 2 9 8 8,5 2 1, 3 9 7 8,0 3 1, 4 9 9 9,0 4 1, 5 9 6 7,5 5 1, 6 9 4 6,5 6 1, 7 9 5 7,0 7 1, 8 9 8 8,5 8 1, 9 9 3 6,0 9 2, 3 8 7 7,5 10 2, 4 8 9 8,5 11 2, 5 8 6 7,0 12 2, 6 8 4 6,0 36 8,9 8 3 5,5 Hạn chế sai số ngẫu nhiên:  Cách tốt nhất để hạn chế sai số ngẫu nhiên là đảm bảo cỡ mẫu đủ lớn. 7
  8. Sai số hệ thống • là bất kỳ sai số nào trong quá trình nghiên cứu làm sai lệch ước lượng sự kết hợp giữa phơi nhiễm và bệnh. • Dẫn tới kết quả chệch, không giá trị • Không có sai số hệ thống= đúng, có giá trị (accurate, valid) Tần số Sai số hệ thống làm thay đổi số đo trung bình nên gọi là sai chệch 8
  9. Các loạ loại sai số hệ thố thống 1. Sai số chọn: xảy ra khi có sự khác biệt hệ thống các đặc tính của những đối tượng được chọn vào nghiên cứu với đặc tính của những người không được chọn vào nghiên cứu do quá trình lựa chọn, phân bổ và sử dụng đối tượng nghiên cứu. Có 2 vấn đề cần quan tâm trong sai số chọn:  Những người tham gia nghiên cứu không đại diện cho quần thể nghiên cứu  Mẫu không ngẫu nhiên  Lựa chọn mẫu nghiên cứu không phù hợp  Các nhóm so sánh khác nhau một cách có hệ thống so với các nhóm khác  Các nhóm được chọn từ các nguồn khác nhau, tỷ lệ khác nhau, mất số liệu  Kết quả chỉ ra mối liên quan giữa yếu tố nguy cơ và bệnh quá cao hoặc quá thấp so với dự kiến (mong đợi) Các nguồn sai số chọn  Lựa chọn đối tượng nghiên cứu không phù hợp  Tự nguyện  Tỷ lệ tham gia thấp (
  10. Sai số chọn trong NC ngang  Câu hỏi đặt ra là:  Các đối tượng tham gia NC có phải là một mẫu đại diện ngẫu nhiên cho quần thể NC hay không?  Quá trình lựa chọn được tiến hành ngẫu nhiên như thế nào?  Tỷ lệ đối tượng đáp ứng là bao nhiêu?  Ví dụ:  Tự nguyện  Không ngẫu nhiên  Tỷ lệ đáp ứng thấp (
  11. Sai số chọn trong NC thuần tập  Câu hỏi đặt ra là:  Các đối tượng tham gia NC có hoàn toàn là không có bệnh (không có vấn đề SK) mà NC quan tâm hay không?  Hai nhóm phơi nhiễm và không phơi nhiễm có sự khác biệt gì không?  Tỷ lệ đối tượng được theo dõi đến cùng là bao nhiêu ở từng nhóm? Sai số chọn trong NC bệnh chứng  Câu hỏi đặt ra là:  Các đối tượng NC có được lựa chọn ngẫu nhiên từ quần thể NC hay không?  Quần thể NC có được làm rõ trong NC hay không?  Ví dụ :  Sai số chuyển tuyến  Sai số do đối tượng NC (tỷ lệ đáp ứng)  Sai số trong tính tỷ lệ hiện mắc hoặc mới mắc 11
  12. Các loạ loại sai số hệ thố thống 2. Sai số đo lường/chẩn đoán  Sai chệch gây ra do đo lường kết quả sai hoặc phân loại sai đối tượng nghiên cứu, nguyên nhân từ phía người làm nghiên cứu hoặc từ đối tượng nghiên cứu  Ví dụ  Các đối tương khác nhau áp dụng quy trình chẩn đoán khác nhau kết quả  Xảy ra khi một hiểu biết về mối quan hệ nhân quả ảnh hưởng đến kết quả chẩn đoán Các loạ loại sai số hệ thố thống 2. Sai số đo lường/chẩn đoán  Các nguồn sai số đo lường/chẩn đoán:  Do đối tượng nghiên cứu  Sai số nhớ lại (recall bias): Loại sai số này thường xảy ra trong các nghiên cứu bệnh chứng và các nghiên cứu thuần tập hồi cứu  Sai số do bối cảnh đo  Sai số do công cụ thu thập thông tin  Sai số quan sát (thu thập thông tin) hay sai số phỏng vấn (interview bias). VD kinh nghiệm người TTTT  Sai số phân loại (xếp lẫn- misclassification): sai số sắp xếp nhầm đối tượng vào nhóm bệnh-không bệnh, phơi nhiễm – không phơi nhiễm. 12
  13. Phân loại sai số đo lường  Sai số đo lường có sự khác biệt (Differential measuarement error)  Sai số đo lường không có sự khác biệt (non- differential error) Sai số đo lường không có sự khác biệt  Sai số xảy ra ở cả hai nhóm so sánh (nhóm bệnh và nhóm chứng trong NC bệnh chứng, nhóm phơi nhiễm và không phơi nhiễm trong NC thuần tập, nhóm can thiệp và không can thiệp trong NC can thiệp)  Kết quả là mối liên quan giữa yếu tố phơi nhiễm và bệnh đo được không như mong muốn (bias toward the null, OR, RR=1) 13
  14. Sai số đo lường có sự khác biệt  Sai số đo lường khác nhau giữa hai nhóm so sánh  Ảnh hưởng đến độ lớn và chiều hướng của sự kết hợp giữa phơi nhiễm và bệnh  Nguyên nhân (nguồn gốc):  Sai số giám sát (VD: đo lường/chẩn đoán tình trạng phơi nhiễm khác nhau giữa hai nhóm)  Sai số nhớ lại: nhóm bệnh thường có xu hướng nhớ rõ hơn về tình trạng phơi nhiễm hơn là nhóm chứng  Sai số phỏng vấn/ quan sát  Hạn chế bằng cách làm mù điều tra viên (không biết về giả thuyết NC, tình trạng bệnh, tình trạng phơi nhiễm…) Hạn chế các sai số hệ thống  Hạn chế tối đa việc đối tượng từ chối tham gia nghiên cứu hoặc bỏ cuộc  lựa chọn chỉ số nghiên cứu và thiết kế phù hợp.  chọn quần thể nghiên cứu phù hợp.  sử dụng quy trình chẩn đoán, theo dõi và đánh giá giống nhau để hạn chế các sai số chẩn đoán.  Chuẩn hoá công cụ đo lường có độ chính xác cao và phải đo đi đo lại nhiều lần.  Sử dụng thống nhất công cụ đo lường, phương pháp tiến hành giữa các đối tượng nghiên cứu. 14
  15. Hạn chế các sai số hệ thống  Đào tạo thống nhất các nghiên cứu viên, điều tra viên, người thu thập số liệu để thực hiện quy trình và phương pháp giống nhau.  không nên hỏi về sự kiện xảy ra quá lâu, quá xa mà đối tượng không thể nhớ được SD nhật ký .  tạo cho đối tượng sự thoải mái khi cung cấp thông tin  Sử dụng nhiều nguồn thông tin đối chiếu  Làm mù, phân bổ đối tượng và NCV ngẫu nhiên Bài tập: xác đinh những sai số có thể có và chiến lược hạn chế sai số  Nghiên cứu xác định tỷ lệ mắc bệnh phụ khoa tại 1 cộng đồng  Nghiên cứu bệnh chứng về liên quan giữa hút thuốc lá và viêm phế quản mạn: chọn bệnh ở khoa hô hấp, chứng ở khoa chấn thương, tai nạn 15
  16. Nghiên cứu xác định tỷ lệ mắc bệnh phụ khoa tại 1 cộng đồng  Sai số ngẫu nhiên  Sai số hệ thống  Sai số chọn:  đối tương đến khám là người có vấn đề tỷ lệ mắc cao hơn.  Chọn khu vực nước ngập/sông nước  Sai số chẩn đoán:  Do kỹ thuật TTTT: dùng hai phương pháp phát hiện khác nhau để chẩn đoán, hoặc người lao động ở vùng sông nước được khám kỹ hơn.  Do đối tượng NC: Nhớ lại triệu chứng không chính xác  Do Phỏng vấn: Bác sĩ nam khám đối tượng ngại kể các dấu hiệu, 2 người PV cho 2 kết quả khác nhau  Xếp lẫn: test có độ nhạy và độ đặc hiệu không cao xếp lẫn Các yếu tố liên quan đến sai số trong quá trình thu thập số liệu Giới, tuổi, học vấn, Giới, tuổi, học vấn, quan kinh nghiệm, quan niệm, sự sẵn sàng, trung niệm, kỹ năng, v.v. Môi trường: thực, v.v. địa điểm, tiếng ồn, thời điểm, mùa, v.v. Đối tượng: Nghiên cứu con người, viên hiện tượng, Phương pháp, phương tiện đo lường: độ chính xác, sự việc thời điểm đo, nhập, mã hóa, kết hợp biến, phần mềm, v.v 16
  17. Yếu tố nhiễu  Yếu tố (biến số) dẫn đến những sai chệch trong việc đo lường mối liên quan giữa phơi nhiễm và bệnh được gọi là yếu tố nhiễu  RR hoặc OR có thể tăng hoặc giảm so với giá trị thực  Đặc biệt quan trọng trong các nghiên cứu phân tích  Một biến có thể nghi ngờ là yếu tố nhiễu khi:  Không nằm trong giả thuyết nghiên cứu  Hội đủ 3 tiêu chuẩn của một yếu tố nhiễu  Yếu tố được coi là nhiễu thực sự khi:  Yếu tố đó bị nghi ngờ là yếu tố nhiễu và kết quả kiểm tra xác định là yếu tố nhiễu Nhiễu 1. Là yếu tố nguy cơ (hoặc bảo vệ) độc lập đối với bệnh 2. Có liên quan đến phơi nhiễm, không phụ thuộc vào phơi nhiễm 3. Không phải là kết quả trung gian giữa phơi nhiễm và bệnh Lưu ý: Nhiễu và phơi nhiễm có thể đổi chỗ cho nhau nếu quan tâm của nghiên cứu thay đổi Phơi nhiễm 3 Bệnh 2 1 Nhiễu 17
  18. Ví dụ về yếu tố nhiễu  Câu hỏi nghiên cứu: Có mối liên quan giữa uống rượu và ung thư gan hay không?  Những yếu tố nào có thể “gây nhiễu” hay “làm sai lệch” mối quan hệ giữa uống rượu và ung thư gan?  Yếu tố nguy cơ: uống rượu  Bệnh: ung thư gan  Liệu có yếu tố nào khác ảnh hưởng đến mối liên quan giữa uống rượu và bệnh ung thư gan hay không? Liệu hút thuốc lá có phải là yếu tố nhiễu hay không? Uống rượu Ung thư gan Hút thuôc lá  HTL không nằm trong giả thuyết NC  HTL có đảm bảo 3 tiêu chuẩn của 1 yếu tố nhiễu không?  Là 1 yếu tố nguy cơ độc lập đối với K gan? ĐÚNG  Có liên quan đến uống rượu hay không? Cần kiểm tra  Không phải là yếu tố trung gian giữa uống rượu và K gan? ĐÚNG 18
  19. Kiểm tra yếu tố nhiễu  Trong 1 NC thuần tập: Uống K gan Tổng rượu Có 615 24,385 25,000 Không 210 24,790 25,000 Tổng 825 49,175 50,000  RR=2,9 Kiểm tra yếu tố nhiễu (tiếp): phân tầng  Nhóm có hút Uống K gan Tổng rượu thuốc lá RR = 1,0 Có 600 19,400 20,000 Không 150 4,850 5,000 Tổng 750 24,250 25,000 Uống K gan Tổng  Nhóm không rượu hút thuốc lá RR=1,0 Có 15 4,985 5,000 Không 60 19,940 20,000 Tổng 75 24,985 25,000 19
  20. So sánh RR  So sánh mối liên quan giữa yếu tố nguy cơ (uống rượu) và bệnh (K gan) trong toàn bộ mẫu NC và phân tầng theo yếu tố nghi ngời nhiễu cho thấy:  RR toàn bộ mẫu = 2,9  Nhóm có hút thuốc lá RR=1,0  Nhóm không hút thuốc lá RR=1,0  Như vậy hút thuốc lá là yếu tố nhiễu ảnh hưởng tới mối liên quan giữa uống rượu và K gan. RR=2,9 rất cao là do yếu tố hút thuốc lá gây ra chứ không phải do uống rượu (hút thuốc lá là “yếu tố gây phiền toái”) Nhiễ Nhi ễu? Béo phì Cao HA Tuổi 20
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2