intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

NGHIÊN CỨU KHOA HỌC NGÀNH Y - Bài 8

Chia sẻ: Nguyen Uyen | Ngày: | Loại File: PDF | Số trang:12

307
lượt xem
10
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Tham khảo tài liệu 'nghiên cứu khoa học ngành y - bài 8', y tế - sức khoẻ, y dược phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả

Chủ đề:
Lưu

Nội dung Text: NGHIÊN CỨU KHOA HỌC NGÀNH Y - Bài 8

  1. PHÂN PHỐI 2 & PHÂN TÍCH TẦN SỐ (Chi-Square Distribution & Analysis of Frequencies) I. GIỚI THIỆU PP. 2 là một kỹ thuật thống kê thường đ ược sử dụng nhất để phân tích số liệu dạng số đếm hoặc tần số. Trong KĐGT, PP. 2 được sử dụng cho số liệu dưới dạng tần số trong 3 trường hợp: + Phép kiểm tính PP. Bình thường (Test of goodness-of-fit ) + Phép kiểm tính độc lập (Test of independence) + Phép kiểm tính đồng nhất (test of homogeneity) Ph ần này đ ặc biệt chỉ xem xét phép kiểm tính độc lập. 6
  2. Tần số quan sát (Observed frequencies) và Tần số mong đợi (Expected frequencies) Số thống kê 2 thích hợp nhất với các biến số nhóm loại (categorical variables). Có hai tập hợp tần số đ ược quan tâm: 1 Tần số quan sát: là số đối tượng hoặc vật thể thuộc mẫu nằm trong các nhóm loại khác nhau của biến số. Thí dụ: n = 100, trong đó thấy có 50 có gia đình, 30 người độc thân, 15 người góa, và 5 người đã li dị. 2 Tần số mong đợi: là số đối tượng hoặc vật thể thuộc mẫu mà chúng ta mong đợi sẽ quan sát thấy nếu (một số) giả thuyết trống (về biến số) đúng. Thí dụ:H0 có thể là trong dân số mà ta rút mẫu bốn nhóm tình trạng gia đình đều có tỉ lệ bằng nhau, nghĩa là chúng ta mong đ ợi sẽ thấy (mẫu n = 100) có 25 người có gia đình, 25 người độc thân, 25 người góa, và 25 người đã li d ị. 7
  3. Số TKKĐ 2: Số TKKĐ cho các phép kiểm 2 là: Oi: tần số quan sát thuộc nhóm loại thứ i  (O  E i ) 2  X 2   i  Ei   Ei: tần số mong đợi (với điều kiện H0 đúng) của nhóm loại thứ i Khi H0 đúng, X2 có PP. 2 với (r – 1)(c – 1 ) độ tự do. c: số cột r: số h àng Đại lượng X2 là số đo mức độ, trong điều kiện cho trước, tương đồng giữa các cặp tần số quan sát và mong đợi. Khi Oi và Ei càng tương đồng với nhau thì X2 càng nhỏ, và khi chúng càng ít tương đồng với nhau thì X2 càng lớn. 0,05 x2 0 8
  4.  ( Oi  E i ) 2  Qui tắc quyết định: Đại lượng    sẽ nhỏ nếu các tần số quan sát và mong Ei   đợi gần bằng nhau, và sẽ lớn nếu hiệu của chúng lớn. Từ chối H0 nếu X2 lớn hơn hoặc bằng giá trị của X2 ở giá trị  đã chọn. II. PHÉP KIỂM TÍNH ĐỘC LẬP (Tests of Independence) Hai tiêu chu ẩn phân loại đư ợc xem là độc lập nhau nếu phân phối của 1 tiêu chuẩn vẫn không đổi cho dù phân phối của tiêu chuẩn kia có là gì đi nữa. Thí dụ: nếu cho rằng tình trạng kinh tế-xã hội và nơi cư trú (trong một thành ph ố) độc lập với nhau, ta sẽ mong đợi tìm thấy tỉ lệ bằng nhau của các gia đình thuộc các nhóm tình trạng kinh tế-xã hội thấp, trung b ình, và cao ở tất cả các khu vực của thành phố. Cách tính tần số mong đợi: tần số mong đợi, dưới giả thuyết trống cho rằng 2 tiêu chuẩn phân loại độc lập với nhau, được tính cho từng ô (cell) bằng cách nhân tổng của hàng (có chứa cell) với tổng của cột (có chứa cell) rồi chia tích này cho đại tổng số n. Thí dụ chứng minh: Mục đích nghiên cứu của 1 nhóm tác giả là nhằm khảo sát giả thuyết cho rằng phụ nữ nhiễm HIV đồng thời với nhiễm Papilomavirus (HPV) sẽ có nhiều khả năng có các bất thư ờng về mặt tế bào ở cổ tử cung hơn phụ nữ chỉ nhiễm 1 ho ặc không nhiễm loại virus nào. Số liệu sau đây do nhà nghiên cứu cung cấp, 9
  5. HIV HT+, TCLS+ HT+, TCLS– HT– HPV Tổng Dương tính 23 04 10 37 Âm tính 10 14 35 59 Tổng 33 18 45 96 Nhà nghiên cứu muốn biết liệu họ có thể kết luận là có mối liên h ệ giữa tình trạng nhiễm HPV và các giai đo ạn nhiễm HIV không? 1. Số liệu: (xem đề bài) 10
  6. 2. Giả định: Mẫu hiện có để phân tích tương đương với 1 mẫu ngẫu nhiên đơn giản rút ra từ dân số có liên quan. 3. Giả thuyết: H0: Tình trạng nhiễm HPV và các giai đo ạn nhiễm HIV độc lập với nhau HA: Hai biến số này không độc lập với nhau (Tình trạng nhiễm HPV và các giai đo ạn nhiễm HIV không độc lập với nhau) Đặt  = 0,05  (Oi  E i ) 2  k X2 =  E  4. Số TKKĐ i 1   i 5. PP. của số TKKĐ: Khi H0 đúng X2 có phân phối gần như  2 với (r – 1 )(c – 1) = (2 – 1)(3 – 1 ) = 2 độ tự do 6. Qui tắc quyết định: Từ chối H0 nếu giá trị X2 tính được bằng hoặc lớn hơn 5,991. 7. Tính số TKKĐ: 11
  7. Tần số mong đợi của ô thứ nhất đư ợc tính bằng (33 x 37)/96 = 12,72. Các ô khác được tính tương tự HPV HIV HT+, TCLS+ HT+, TCLS– H T– Tổng Dương tính 23 (12,72) 4 (6,94) 10 (17,34) 37 Âm tính 10 (20,28) 14 (11,06) 35 (27,66) 59 33 18 45 96  (Oi  Ei ) 2  (23  12,72) 2 (4  6,94) 2 (35  27,66) 2 k X2 =  E  =   .....  12,72 6,94 27,66 i 1   i 12
  8. = 8 ,30805 + 1,24548 + .. ..+ 1,94778 = 20,60081 8. Quy ết định thống kê: Từ chối H0 vì 20,60081 > 5,991 9. Kết luận: Có mối liên quan giữa tình trạng nhiễm HPV và các giai đoạn nhiễm HIV. p < 0,005. Trư ờng hợp tần số mong đợi nhỏ: Theo Cochran: + Đối với các bảng chéo (contingency table) có > 1 độ tự do, giá trị của tần số mong đợi nhỏ nhất cho phép là b ằng 1 với điều kiện không có > 20% số ô có tần số mong đợi < 5. Để thỏa được điều kiện n ày, người ta thường phải dồn cột hoặc h àng lại. + Đối với trường hợp PP. 2 với < 30 độ tự do , có th ể chấp nhận giá trị của tần số mong đợi nhỏ bằng 2. TRƯỜNG HỢP BẢNG CHÉO 2 X 2 13
  9. Tiêu chuẩn phân Tiêu chuẩn phân loại thứ nhất Tổng lo ại thứ hai 1 2 1 a b a+b 2 c d c+d a+c b+d n Tổng X2 có thể được tính bằng cách đon giản hơn: n(ad  bc) 2 X2 = (a  c)(b  d )(a  b)(c  d ) a, b, c, d: tần số quan sát của các ô. Phân phối 2 này có (r – 1)(c –1) = 1 độ tự do. Trường hợp tần số mong đợi nhỏ của bảng 2 x 2: Cochran cho rằng không nên dùng phép kiểm 2 nếu 14
  10. n < 20 hoặc + + 20 < n < 40 + có tần số mong đợi < 5 Khi n  40, có thể chấp nhận 1 tần số mong đợi nhỏ bằng 1. Điều chỉnh Yates (Yates’s correction) Các tần số quan sát trong b ảng chéo là biến số rời, nhưng lại đưa đến PP. mẫu X2 có PP. liên tục. Điều chỉnh Yates là công cụ để điều chỉnh sự việc này cho trường hợp bảng 2 x 2. Việc điều chỉnh được tiến hành bằng cách lấy giá trị tuyệt đối của đại lượng 1 \ad – bc\ trừ cho tổng số các quan sát trước khi b ình phương. Khi này, 2 n(\ ad  bc \ 0,5n) 2 X2 = (a  c)(b  d )(a  b)(c  d ) Ghi chú: Trong các software về TKYH, kết quả X2 của test of independence thường được trình bày dưới dạng kết quả của Pearson (lấy theo tên Karl Pearson, một trong nh ững người đã phát triển phép kiểm 2). 15
  11. III. FISHER EXACT TEST Trong trường hợp bảng 2 x2, khi các điều kiện về cỡ mẫu không được thỏa thì Fisher Exact Test có thể là một lựa chọn thay thế. Sắp xếp số liệu: khi dùng Fisher Exact Test, cần sắp xếp số liệu trong bảng 2 x 2 theo cách sao cho A > B và chọn đặc điểm có liên quan sao cho a/A > b/B Tổng Có đặc điểm Không có đặc điểm Mẫu liên quan liên quan 1 a A–a A 2 b B–b B 16
  12. Tổng a+b A+B–a–b A+B Giả định: 1/ Mẫu A lấy từ dân số 1 và mẫu B lấy từ dân số 2. 2/ Các mẫu đều ngẫu nhiên và độc lập. 3/ Mỗi quan sát có thể đư ợc nhóm loại thành 1 trong 2 lo ại độc lập hỗ tương. Số TKKĐ: Số TKKĐ là b , số lư ợng nằm trong mẫu 2 có mang đặc điểm liên quan. Qui tắc quyết định: Từ chối H0 khi b hiện có bằng hoặc nhỏ h ơn giá trị tới hạn (tương ứng với ngưỡng có ý ngh ĩa thống kê). ----------------------------------------------------------- 17
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2