GIỚI THIỆU MÔN HỌC
XÁC SUẤT – THỐNG KÊ Y HỌC
ThS. Bùi Thị Kiều Anh
Nội dung
Giới thiệu môn học Thảo luận phương pháp học Thống kê và vai trò của thống kê trong y học Các mức độ của thống kê phân tích Các thiết kế nghiên cứu cơ bản Bài tập thực hành
Thống kê …
“Thống kê rất chán – Và không có gì có thể giúp nó thú vị hơn.”
“Thống kê là một môn học bị sinh viên ghét nhất.”
Một nhà thống kê y học chỉ an ủi rằng:
“Sinh viên y khoa có thể không thích thống kê, nhưng khi trở thành bác sỹ hoặc nhân viên y tế họ sẽ thích”.
Đơn giản: không cần thiết: VD?
Phức tạp: công cụ then chốt: VD: bảo hiểm
Thống kê có thể làm gì?
Tóm tắt và trình bày thông tin bằng số;
Kiểm định một giả thuyết; và cho phép đo lường mức độ chắc
chắn của kết luận(tình cờ);
So sánh thông tin từ các nhóm khác nhau
Tiên đoán được khả năng một biến cố xảy ra đối với một bệnh
nhân cụ thể/nhóm đối tượng và ước lượng mức độ chính xác
của tiên đoán.
Thống kê có ích
Những biến cố không lường trước được (VD:mắc bệnh, tử vong);
Thông tin có được từ nghiên cứu trên 1 số lớn đối tượng;
Những yếu tố có liên quan không dễ dàng được kiểm soát; (VD:hành vi)
Những yếu tố có liên quan là chưa rõ.(climate change)
Môn học Xác suất - Thống kê Y học
Thời gian: 15 tuần 3 tiết/tuần x 15 tuần = 45 tiết. Môn học bao gồm các kiến thức cơ bản về xác suất và thống kê
dùng trong lĩnh vực y học.
Các kỹ thuật chọn lựa và phân tích số liệu được giảng dạy giúp sinh viên có thể áp dụng trong đọc, hiểu, biện luận các nghiên cứu khoa học chuyên ngành và trong thực hiện các nghiên cứu khoa học của bản thân.
Nội dung bài giảng
1. Giới thiệu xác suất - thống kê y học
2. Giới thiệu xác suất - thống kê y học (tt)
3. Các chỉ số thống kê trong y học
4. Các chỉ số thống kê trong y học (tt)
5. Các chỉ số thống kê trong y học (tt)
6.
Thực hành
7.
Thống kê mô tả
8. Ôn thi
9.
Thi giữa kỳ
10. Thống kê mô tả (tt)
11. Giới thiệu các bước kiểm định
12. Kiểm định chi bình phương
13. Kiểm định t-test không bắt cặp
14. Bài tập thực hành
15. Ôn thi cuối khóa
Mục tiêu môn học:
Sau khi hoàn thành môn học, sinh viên có khả năng: Ứng dụng được các khái niệm xác suất thống kê phù hợp trong
bối cảnh y học
Hiểu nguyên tắc của các kiểm định giả thuyết Lựa chọn các kiểm định thống kê phù hợp nhất để sử dụng cho
các giả thuyết khoa học
Diễn giải và báo cáo các kết quả của các phân tích thống kê cơ
bản
Giải thích được các phương pháp thống kê cơ bản được sử dụng
trong các báo cáo y tế hoặc bài báo nghiên cứu khoa học
Phương pháp học
Giảng dạy trực tiếp Bài tập thực hành tại lớp Thảo luận nhóm, thảo luận chung Kiểm tra giữa khóa: Bài tập Kiểm tra cuối khóa: trắc nghiệm Điểm môn học = 60% điểm thi cuối khóa + 30% điểm giữa kỳ (sau tuần thứ 8)
+10% chuyên cần
Điểm danh hằng ngày, ngẫu nhiên. Tư vấn, trả lời thắc mắc ngoài giờ học:
Email: camhong3011@gmail.com; buithikieuanh85@gmail.com 0906801279.
Xác suất - Thống kê y học
Thống kê và vai trò của thống kê trong y học
Thống kê là khoa học về
Thu thập
Phân tích
Lí giải số liệu
Vai trò quan trọng của thống kê là khái quát/suy diễn kết quả từ
mẫu cho quần thể
Quần thể
Mẫu
Các khái niệm thường gặp trong thống kê
Ví dụ: Cân nặng, Tuổi, Giới, Dân tộc, Tình trạng suy dinh dưỡng, Tình trạng bệnh tật, Hiệu quả điều trị,….
Biến số là những đại lượng hay những đặc tính có thể thay đổi từ người này sang người khác hay từ thời điểm này sang thời điểm khác
Đơn vị quan sát (observational unit) là chủ thể hoặc người mà sự quan sát hoặc đo lường sẽ được tiến hành trên chủ thể đó khi thực hiện nghiên cứu
Quần thể (population) là bao gồm toàn bộ các cá thể mà chúng ta quan tâm
Quần thể
Mẫu
Mẫu (sample) là một phần của quần thể, bao gồm những cá thể mà chúng ta sẽ nghiên cứu. Mẫu được chọn ra để quan sát và dùng để suy diễn cho toàn bộ tổng thể
Quần thể và mẫu:
Thật lý tưởng nếu chúng ta biết điều gì đó về quần thể Thường ta không thể thu thập thông tin từ toàn bộ quần thể Thay vào đó ta sẽ thu thập mẫu Kết quả từ mẫu nghiên cứu được dùng để suy diễn kết quả cho toàn bộ
quần thể mà chúng ta không biết
Kết quả của mẫu cần phải có giá trị để phản ánh chính xác đặc điểm
của quần thể
Ví dụ:
Để tìm hiểu về tình trạng suy dinh dưỡng của trẻ 5 tuổi của TP.HCM năm 2015, một khảo sát đã được thực hiện trên 500 trẻ em 5 tuổi tại 5 quận/huyện 1, 3, 6, Bình Tân, huyện Cần Giờ. Các nhà nghiên cứu đã hỏi về cân nặng, chiều cao lúc sinh, tháng tuổi và đo cân nặng, chiều cao hiện tại.
Câu hỏi: Trong nghiên cứu trên:
Quần thể là gì? Mẫu là gì? Gồm các biến nào?
Ví dụ:
Để tìm hiểu về tình trạng suy dinh dưỡng của trẻ em 5 tuổi của TP.HCM năm 2015, một khảo sát đã được thực hiện trên 500 trẻ em 5 tuổi tại 5 quận/huyện 1, 3, 6, Bình Tân, huyện Cần Giờ. Các nhà nghiên cứu đã hỏi về cân nặng, chiều cao lúc sinh, tháng tuổi và đo cân nặng, chiều cao hiện tại.
• Quần thể: trẻ em 5 tuổi sống tại TP.HCM năm 2015 • Mẫu: 500 trẻ em 5 tuổi đang sống tại 5 quận/huyện 1,
3, 6, Bình Tân, và huyện Cần Giờ
• Các biến trong nghiên cứu: - cân nặng lúc sinh - chiều cao lúc sinh - tháng tuổi - cân nặng hiện tại - chiều cao hiện tại
Sinh thống kê là sử dụng thống kê để giải đáp những vấn đề về
sinh học, y sinh học hoặc khoa học sức khỏe.
Thống kê mô tả (Descriptive statistics): nghiên cứu việc tổng
hợp, số hóa, biểu diễn bằng đồ thị các số liệu thu thập được. Sau đó tính toán các tham số đặc trưng cho tập hợp dữ liệu như: trung bình, phương sai, tần suất, tỷ lệ, ...Mục đích là để mô tả tập dữ liệu đó.
Thống kê suy luận (Inferential statistics): là quá trình nghiên cứu sự ngẫu nhiên, sai số của dữ liệu thu thập từ mẫu, từ đó mô hình hóa và đưa ra các suy luận cho tổng thể. Các suy luận này có thể là: trả lời đúng / sai cho các giả thuyết đặt ra (kiểm định giả thuyết thống kê), ước lượng các tham số của tổng thể (ước lượng), mô tả sự tác động qua lại giữa các biến số (tương quan), mô hình hóa quan hệ giữa các biến số (hồi quy).
Vai trò của máy tính và phần mềm thống kê
Các phần mềm thống kê sẽ giúp bạn nhanh chóng phân tích một
khối lượng dữ liệu lớn.
Ví dụ: dữ liệu bệnh viện: thời gian nằm viện, danh sách
các bệnh, chi phí điều trị,… Một số phần mềm thông dụng: SPSS, STATA, R Tuy nhiên: “rác vào thì rác lại ra” Máy tính và các phần mềm thống kê sẽ thực hiện các phân tích
do bạn đề nghị và sử dụng dữ liệu mà bạn cung cấp
Máy tính và các phần mềm thống kê không thể nói cho bạn biết phân tích bạn chọn có giá trị để trả lời cho câu hỏi bạn đặt ra không.
Do đó cần phải có KỸ NĂNG THỐNG KÊ
Nghiên cứu và thống kê
Xác định vấn đề nghiên cứu
Tổng quan y văn
Khái quát –Xây dựng ý tưởng
Xem xét y đức
Thiết kê nghiên cứu định lượng
Thiết kế nghiên cứu định tính
Lập kế hoạch nghiên cứu
Cách chọn mẫu, lấy mẫu
Thu thập dữ liệu
Độ tinh cậy và tính giá trị
Thực hiện nghiên cứu
Thốn g kê
Phân tích dữ liệu
Diễn giải kết quả nghiên cứu
Ứng dụng nghiên cứu
Thực hành dựa trên bằng chứng
Các mức độ của phân tích
Đơn biến
Nhị biến
Đa biến
Phân tích đơn biến
Tình trạng bệnh (có bệnh/không bệnh)
• Số lượng • % • Tỷ lệ mắc bêênh
• Trung bình • BMI
Cân nặng (kg)
• Số lượng • %
Giới tính (nam/nữ)
Chỉ phân tích một biến số duy nhất
Phân tích nhị biến
Phân tích mối quan hệ của 2 biến số
Tình trạng bệnh (có bệnh/không bệnh) Giới tính (nam/nữ)
Giới tính là biến số độc lập Tình trạng bệnh là biến số phụ thuộc
Cân nặng (kg) Tình trạng bệnh (có bệnh/không bệnh)
Cân nặng là biến số phụ thuộc Tình trạng bệnh là biến số độc lập
Phân tích đa biến
Phân tích sự liên hệ giữa 3 hay nhiều biến số
Giới tính (nam/nữ)
Tình trạng bệnh (có bệnh/không bệnh)
Tình trạng bệnh là biến số phụ thuộc Số giờ tập thể dục mỗi tuần
Nhiều biến số độc lập
Chất lượng nghiên cứu
Thiết kế nghiên cứu
Cao
Nghiên cứu định lượng
Nghiên cứu định tính
NC thực nghiệm (can thiệp)
NC bán thực nghiệm
NC quan sát (không can thiệp)
NC đoàn hệ
NC bệnh chứng
NC so sánh hay phân tích
NC cắt ngang
NC báo cáo loạt ca bệnh
NC mô tả
NC trường hợp
Thấp
Thiết kế nghiên cứu
Nghiên cứu định tính là phương pháp chủ yếu thu thập dữ liệu bằng chữ và là phương pháp tiếp cận nhằm tìm cách mô tả và phân tích đặc điểm của nhóm người từ quan điểm của nhà nhân học.
Ví dụ: Những rào cản trong tiếp cận điều trị ARV sớm ở bệnh nhân HIV
Nghiên cứu định lượng là phương pháp chủ yếu thu thập dữ liệu
bằng số. Nghiên cứu được áp dụng với các hiện tượng có thể được diễn tả bằng số lượng. Nghiên cứu sử dụng phương pháp thống kê để lượng hóa, đo lường, phản ánh và diễn giải các mối quan hệ của các nhân tố (các biến) với nhau.
Ví dụ: Mức độ hài lòng của khách hàng đối với chất lượng dịch vụ CSSKSS So sánh chi phí điều trị ung thư cổ tử cung ở giai đoạn sớm và muộn
Nghiên cứu định lượng
Có nhiều cách phân loại nghiên cứu, nhưng người ta thường chia làm 2 loại:
Nghiên cứu thực nghiệm (can thiệp)
Nghiên cứu quan sát (không can thiệp)
Nghiên cứu thực nghiệm (can thiệp)
Nhà nghiên cứu tác động lên tình hình và đo lường kết quả của việc tác động đó. Thông thường có hai nhóm được so sánh: nhóm được can thiệp và nhóm chứng (không được can thiệp)
Ví dụ: Để nghiên cứu hiệu quả giảm đau của loại thuốc A, người ta tiến hành trên 2 nhóm bệnh nhân. 1 nhóm được cho uống loại thuốc mới A và 1 nhóm được cho uống giả dược. Sau một thời gian, người ta đo lường tình trạng đau của 2 nhóm bệnh nhân.
Nghiên cứu can thiệp
Bệnh
Nhóm được can thiệp
Không bệnh
Ngẫu nhiên
Quần thể
Bệnh
Nhóm không được can thiệp / Nhóm chứng
Không bệnh
3 đặc điểm quan trọng mà nghiên cứu thực nghiệm phải có:
Có can thiệp chủ động và đặc hiệu của nghiên cứu
Có nhóm đối chứng
Việc chọn các đối tượng phân vào các nhóm phải ngẫu nhiên
Ví dụ: Một công trình nghiên cứu HOPE (Heart Outcomes Prevention Evaluation) tuyển chọn 9297 bệnh nhân trên 55 tuổi có nguy cơ bệnh tim mạch cao (tiền sử bệnh tim mạch, đột quị, tiểu đường, và ít nhất là một yếu tố nguy cơ như cao huyết áp, tăng cholesterol, hút thuốc lá, v.v…). Bệnh nhân được chia thành hai nhóm một cách ngẫu nhiên:
- nhóm dùng ramipril (10 mg/ngày) - nhóm chứng (placebo/giả dược)
Bệnh nhân được theo dõi trong vòng 5 năm. Trong thời gian theo dõi, các nhà nghiên cứu ghi nhận các biến cố lâm sàng như nhồi máu cơ tim, đột quị, hay tử vong do bệnh tim mạch.
Câu hỏi: 1. Số lượng mẫu là bao nhiêu? 2. Đơn vị quan sát là gì? Bao nhiêu? 3. Thời gian theo dõi nghiên cứu? 4. Đây có được gọi là nghiên cứu thực nghiệm không? Tại sao? Nếu được thì can thiệp trong nghiên cứu này là gì? 5. Các biến (có thể) trong nghiên cứu này là gì?
Ví dụ: Một công trình nghiên cứu HOPE (Heart Outcomes Prevention Evaluation) tuyển chọn 9297 bệnh nhân trên 55 tuổi có nguy cơ bệnh tim mạch cao (tiền sử bệnh tim mạch, đột quị, tiểu đường, và ít nhất là một yếu tố nguy cơ như cao huyết áp, tăng cholesterol, hút thuốc lá, v.v…). Bệnh nhân được chia thành hai nhóm một cách ngẫu nhiên:
- nhóm dùng ramipril (10 mg/ngày) - nhóm chứng (placebo/giả dược)
Bệnh nhân được theo dõi trong vòng 5 năm. Trong thời gian theo dõi, các nhà nghiên cứu ghi nhận các biến cố lâm sàng như nhồi máu cơ tim, đột quị, hay tử vong do bệnh tim mạch.
Câu hỏi: 1. Mẫu: 9297 bệnh nhân trên 55 tuổi có nguy cơ bệnh tim mạch cao 2. Đơn vị quan sát: 9297 bệnh nhân trên 55 tuổi có nguy cơ bệnh tim mạch cao 3. Thời gian theo dõi nghiên cứu: 5 năm
Ví dụ: Một công trình nghiên cứu HOPE (Heart Outcomes Prevention Evaluation) tuyển chọn 9297 bệnh nhân trên 55 tuổi có nguy cơ bệnh tim mạch cao (tiền sử bệnh tim mạch, đột quị, tiểu đường, và ít nhất là một yếu tố nguy cơ như cao huyết áp, tăng cholesterol, hút thuốc lá, v.v…). Bệnh nhân được chia thành hai nhóm một cách ngẫu nhiên:
- nhóm dùng ramipril (10 mg/ngày) - nhóm chứng (placebo/giả dược)
Bệnh nhân được theo dõi trong vòng 5 năm. Trong thời gian theo dõi, các nhà nghiên cứu ghi nhận các biến cố lâm sàng như nhồi máu cơ tim, đột quị, hay tử vong do bệnh tim mạch.
Câu hỏi: 4. Đây được gọi là nghiên cứu thực nghiệm vì đáp ứng đủ 3 đặc tính của 1 nghiên cứu thực nghiệm: có thực hiện can thiệp, có nhóm chứng và chia nhóm ngẫu nhiên. Can thiệp trong nghiên cứu này là sử dụng thuốc ramipril (10mg/ngày)
5. Các biến (có thể) trong nghiên cứu là: Tuổi, Can thiệp (có/không), Tình trạng nhồi máu cơ tim (có/không), Tình trạng đột quị (có/không), Tử vong do bệnh tim mạch (có/không).
Nghiên cứu quan sát (không can thiệp)
Nhà nghiên cứu chỉ quan sát các hiện tượng xảy ra
Gồm: nghiên cứu mô tả và nghiên cứu so sánh
Nghiên cứu mô tả
Nghiên cứu mô tả bao gồm việc thu thập và trình bày có hệ thống các số liệu nhằm cung cấp một bức tranh về một tình huống cụ thể. Ðôi khi nhà nghiên cứu thường kết hợp sự mô tả dân số nghiên cứu với sự so sánh các nhóm trong dân số. Mặc dù nghiên cứu này cũng sử dụng phương pháp so sánh tương tự như nghiên cứu phân tích, khi chỉ so sánh các nhóm khác nhau, bản chất của nghiên cứu này vẫn là nghiên cứu mô tả.
Nghiên cứu mô tả nhằm báo động, tìm hiểu một số đặc điểm hay ước lượng quy mô của một vấn đề sức khoẻ hay tìm hiểu kiến thức, thái độ, hành vi của người dân về vấn đề đó để đề xuất các giải pháp can thiệp.
Các ví dụ: Thực hành về tiêm chủng, xét nghiệm và điều trị liên quan đến viêm
gan B ở những người Việt Nam nhập cư tại Úc
Thực trạng thừa cân béo phì ở trẻ mầm non tại TPHCM Báo cáo chẩn đoán và điều trị thành công 1 ca tắc mạch ối xuất hiện
trong chuyển dạ, cả sản phụ và sơ sinh đều được cứu sống
Báo cáo 14 trường hợp viêm ruột thừa do vòng tránh thai
Nghiên cứu so sánh hay nghiên cứu phân tích
Là nghiên cứu phân tích các yếu tố ảnh hưởng làm gia tăng tỷ
lệ bệnh trong một dân số.
Nguyên lí của phương pháp này là so sánh tỉ lệ mắc bệnh của hai
nhóm dân số: một dân số có tiếp xúc với yếu tố nguy cơ và
một dân số không tiếp xúc với yếu tố nguy cơ
Gồm: nghiên cứu đoàn hệ và nghiên cứu bệnh chứng
Nghiên cứu đoàn hệ
Bệnh
Phơi nhiễm
Không bệnh
Quần thể những người không có bệnh
Bệnh
Không phơi nhiễm
Không bệnh
Thời gian
Hướng nghiên cứu
Ví dụ:
Nghiên cứu trên các bác sĩ Anh quốc (The British Doctor’s study). Nghiên cứu được bắt đầu tiến hành vào năm 1951 trong đó 34.440 nam bác sĩ được hỏi về tình trạng hút thuốc lá (có hay không) và được theo dõi về tử vong do ung thư phổi trong vòng 20 năm.
Kết quả cho thấy nguy cơ tử vong hàng năm do ung thư phổi ở người không hút thuốc lá là 10/100.000 trong khi nguy cơ tử vong hàng năm do ung thư phổi ở người hút thuốc lá là 140/100.000. Như vậy hút thuốc lá làm tăng nguy cơ ung thư phổi lên 14 lần (nguy cơ tương đối là 14) và như vậy hút thuốc lá được gọi là yếu tố nguy cơ (hay nguyên nhân) của ung thư phổi.
Nghiên cứu bệnh chứng: chọn nhóm
Người bệnh
Nhóm bệnh
Quần thể những người không có bệnh
Chọn mẫu
Nhóm chứng
Người không bệnh
Thời gian
Nghiên cứu bệnh chứng
Phơi nhiễm
Nhóm bệnh
Không phơi nhiễm
Phơi nhiễm
Nhóm chứng
Không phơi nhiễm
Hướng nghiên cứu
Thời gian
Ví dụ:
Yếu tố nguy cơ ung thư vú ở phụ nữ Việt Nam: nghiên cứu bệnh chứng tại BV Ung bướu TPHCM năm 2010
Nghiên cứu nhằm xác định mối liên quan giữa các yếu tố nhân trắc, các yếu tố liên quan đến sinh sản với nguy cơ mắc ung thư vú trên các nữ bệnh nhân nhập viện tại Bệnh viện Ung bướu TPHCM.
Nhóm bệnh là 115 bệnh nhân mới có chẩn đoán chính xác ung thư vú dựa trên các tiêu chí khám lâm sàng, siêu âm và kết quả giải phẫu bệnh.
Nhóm chứng là 115 người bao gồm các nữ giáo viên tại một số trường tiểu học và mầm non tại quận Gò Vấp và Tân Bình.
Kết quả cho thấy những người có tiền căn gia đình bị ung thư vú (có mẹ hoặc chị em gái ruột), thì có nguy cơ bị ung thư vú cao hơn những người khác 6,14 lần
Chất lượng nghiên cứu
Thiết kế nghiên cứu
Cao
Nghiên cứu định lượng
Nghiên cứu định tính
NC thực nghiệm (can thiệp)
NC bán thực nghiệm
NC quan sát (không can thiệp)
NC đoàn hệ
NC bệnh chứng
NC so sánh hay phân tích
NC cắt ngang
NC báo cáo loạt ca bệnh
NC mô tả
NC trường hợp
Thấp
Tóm lại
Thống kê là những gì liên quan đến việc thu thập, phân tích và diễn
giải các dữ liệu thu thập và kiểm định mối quan hệ hoặc sự khác biệt giữa các nhóm cá thể.
Các cá thể này có thể là người, hộ gia đình, số lần khám bệnh … phụ
thuộc vào mục đích của việc nghiên cứu.
Dữ liệu có thể bao gồm từ các phép đo lường, phân tích phức tạp
đến các đặc điểm dân số học đơn giản như tuổi, giới tính, nơi ở, tình trạng hôn nhân,…
3 cấp độ phân tích (đơn biến, nhị biến và đa biến) Các thiết kế nghiên cứu khác nhau về chất lượng
Good study!!!
Một nghiên cứu nhằm đánh giá hiệu quả hoạt động truyền thông trong thay đổi kiến thức - thực hành của người dân về phòng chống bệnh sốt xuất huyết (SXH) tại xã Bảo Vinh, thị xã long Khánh, tỉnh Đồng Nai.
Nghiên cứu được tiến hành bằng các hoạt động truyền thông tại cộng đồng và được đánh giá trước và sau can thiệp bằng cách phỏng vấn trực tiếp người dân tại các hộ gia đình. Mỗi gia đình chọn đại diện một người, tuổi từ 18 trở lên và không mắc các bệnh tâm thần, câm, điếc,...để trả lời đầy đủ, không ảnh hưởng kết quả các câu hỏi.
Một số kết quả nghiên cứu: Tỉ lệ kiến thức người dân nhận biết muỗi vằn là tác nhân truyền bệnh
trước can thiệp là 59%, sau can thiệp là 75%.
Tỉ lệ khảo sát thực hành của người dân về súc rửa dụng cụ chứa nước
trước can thiệp là 58,50%, sau can thiệp là 78%.