
Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học.
Chủ biên: Lưu Ngọc Hoạt (2017) 50
BÀI 4
PHƯƠNG PHÁP THỐNG KÊ Y SINH HỌC
NỘI DUNG HỌC TẬP
Việc trình bày số liệu thu thập đuợc trong nghiên cứu là một công việc hết sức quan
trọng để the hiện kết quả của nghiên cứu. số liệu sau khi thu thập thuờng là hỗn độn, vì
vậy, muốn từ các số liệu ấy tính toán các giá trị đặc trưng và thực hiện các kỹ thuật suy
luận thống kê để rút ra những kết luận có giá trị, ta phải biết cách sắp xếp và trình bày số
liệu một cách rõ ràng, gọn và có hệ thống
Hai chiến luợc cơ bản giúp chúng ta tiến hành khảo sát một bộ số liệu:
(1). Bắt đầu bằng khảo sát từng biến. Sau đó chuyển sang nghiên cứu mối tuơng
quan giữa các biến
(2). Bắt đầu với một bảng/biểu/đồ thị hoặc nhiều bảng/biểu/đồ thị. Sau đó bổ
sung các số liệu tống hợp về những đặc trưng cụ thể của số liệu
Chúng ta cần tuân thủ những nguyên tắc nàỵ trong suốt quá trình phân tích. Trong
bài học này, chúng ta sẽ băt đâu băng việc trình bày các bảng phân phối tần số, và bằng
các biểu đồ, đồ thị
1. BẢNG PHÂN PHỐI TẦN SỐ
1.1. Tiêu chuẩn của một bảng tốt
Mặc dù không có một quy định nào chặt chẽ về việc trình bày số liệu bằng bảng,
nhưng có một vài nguyên tắc chung đươc coi là tiêu chuẩn:
+ Bảng càng cần đơn giản càng tốt: nên dùng bảng đơn giản để người đọc dễ hiểu hơn
là bảng phức tạp với nhiều biến số. Nhìn chung, một bảng nên chỉ được lập với tối
đa là 3 biến số.
+ Bảng cần phải đảm bảo yếu tố tự giải thích
MỤC TIÊU HỌC TẬP
1. Lập được kế hoạch phân tích và trình bày số liệu
2. Lựa chọn được phương pháp thống kê phù hợp với các loại số liệu
3. Trình bày được một bộ số liệu cụ thể dưới dạng các bảng, biểu đồ và đồ thị thích
hợp, và phiên giải được ý nghĩa của số liệu trong các bảng, biểu, đồ thị

Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học.
Chủ biên: Lưu Ngọc Hoạt (2017) 51
+ Các mã hóa, chữ viết tắt hoặc biểu tượng cần phải giải thích cụ thể trong phần chú
thích ở cuối trang
+ Cần ghi rõ ràng và chính xác trong từng dòng và từng cột
+ Các đơn vị đo lường cụ thế cho từng số liệu cần được chỉ rõ
+ Tiêu đề của bảng cũng cần phải rõ ràng, chính xác và đúng trọng tâm. cần trả lời
các câu hỏi: Cái gì? Khi nào? Ở đâu?
+ Số tổng cộng cần phải được trình bày trong bảng
+ Tiêu đề của bảng cần phải được phân cách với nội dung bảng bằng dòng kẻ hoặc
một khoảng cách dòng. Trong các bảng nhỏ, các dòng kẻ ngang phân cách các dòng
có thế không cần thiết.
+ Nếu số liệu là trích dẫn, thì nguồn gốc, xuất xứ của số liệu cần được chỉ rõ trong
phần chú thích ở dưới bảng.
1.2. Các loại bảng phân phối tần số
1.2.1. Bảng phân phổi tần số một chiều
Dùng để trình bày sự phân phối của một đặc tính khảo sát
Khảo sát cho biến định tính
Bảng 2. Phân bố trình độ học vấn của dân số trong độ tuổi 25-34
Trình độ học vấn
Số lượng
(triệu ngưòi)
Tỷ lệ phần trăm
(%)
Chưa tốt nghiệp THPT
4,6
12,1
Tốt nghiệp THPT
11,6
30,5
Trung cấp
7,4
19,5
Cao đẳng
3,3
8,7
Đại học
8,6
22,6
Sau đại học
2,5
6,6

Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học.
Chủ biên: Lưu Ngọc Hoạt (2017) 52
Khảo sát cho biến định lượng
Bảng 3. Phân bố chiều cao của 40 thanh niên
Lớp
Ranh giới lớp
(cm)
Giá trị trung
tâm (cm)
Tần số
(n)
Tần số tương
đối (%)
Tần số tương đối
cộng dồn (%)
1
150,5 - 153,5
152
1
2,5
2,5
2
153,5 - 156,5
155
3
7,5
10
3
156,5 - 159,5
158
7
17,5
27,5
4
159,5 - 162,5
161
9
22,5
50
5
162,5 - 165,5
164
8
20,5
70
6
165,5 - 168,5
167
6
15,0
85
7
168,5 -171,5
170
4
10,0
95
8
171,5 -174,5
173
2
5,0
100
Tống
40
100
Trong bảng trên, các số liệu đã được phân nhóm thành từng lớp:
+ Cột 1: Số thứ tự của lớp
+ Cột 2: Ranh giới lớp, được xác định sao cho mỗi trường hợp khảo sát phải thuộc
một lớp
+ Cột 3: Giá trị trung tâm là giá trị đại diện cho mọi trường hợp trong lớp, được tính
bằng trung bình cộng của ranh giới trên và dưới của lớp
+ Cột 4: Số trường hợp quan sát được trong môi lớp, được gọi là tần số của lớp
+ Cột 5: Tần số tương đối của lớp là tỷ lệ phần trăm giữa tần số của lớp với tống số
trường hợp quan sát (ở đây là 100). Sử dụng tần số này ta có thể thực hiện được
việc so sánh giữa các tập hợp số liệu đồng dạng với nhau (ví dụ chiều cao thanh
niên) dù tống số trường hợp quan sát của mỗi tập hợp khác nhau.
+ Cột 6: Tần số tương đối cộng dồn xác định tỷ lệ phần trăm những thanh niên có
chiều cao dưới một giới hạn nào đó. Ở bảng này, có 50% thanh niên có chiều
cao<162,5 cm

Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học.
Chủ biên: Lưu Ngọc Hoạt (2017) 53
1.2.2. Bảng phân phối tần số hai chiều (2x2)
Dùng để trình bày sự phân phối của một đặc tính khảo sát tương quan với một đặc
tính khác.
Bảng 4. Kết quả xét nghiêm Creatinine Kinase (CK) trên bệnh nhân nghi ngờ mắc
nhồi máu cơ tim cấp tính
Ket quả test CK
Nhồi máu cơ tim cấp (AMI)
Tổng
Bệnh
Không bệnh
Dương tính (>80IU)
215
16
231
Âm tính (<80IU)
15
114
129
Tổng
230
130
360
Bảng 5. Liên quan giữa tuổi - chiều cao của 100 trẻ
Chiều cao
(cm)
Tuổi (năm)
Tổng
3-4
5-6
7-8
75-84
15
8
2
25
85-94
10
32
13
55
95-104
0
5
15
20
Tổng
25
45
30
100
1.2.4. Bảng giả (bảng câm)
Bảng giả là một loại bảng có đầy đủ tên bảng, các tiêu đề cho cột và dòng nhưng
chưa có số liệu. Bảng này được thiết kế trong giai đoạn lập đề cương nghiên cứu đế cho
nhà nghiên cứu có sẵn ý tưởng cho thiết kế và thu thập số liệu.
Trình độ học vấn của mẫu
Số lượng (n)
Tỷ lệ (%)
Chưa tốt nghiệp THPT
Tốt nghiệp THPT
Cao đẳng - Đại học
Sau đại học
Tóm tắt số liệu sẽ được tiến hành và đơn giản hóa bằng việc trước hết cần chuẩn bị
một bảng tổng thế. Trong bảng này, tất cả các số liệu sẵn có cần được phân loại một cách
hoàn chỉnh. Khi việc phân loại số liệu hoàn tất, chúng ta có thể thu được số liệu liên quan
đến biến số đơn hoặc tập hợp của các biến số mà không cần phải dựa vào số liệu ban đầu.

Giáo trình môn học: Thống kê sinh học & Nghiên cứu Y học, NXB Y học.
Chủ biên: Lưu Ngọc Hoạt (2017) 54
2. Biểu đồ và đồ thị
2.1. Nguyên tắc chung
Khi biểu đồ, đồ thị đã được vẽ một cách chính xác, người đọc có thể hiểu toàn bộ
số liệu một cách nhanh chóng. Một vài nguyên tắc quan trọng nhất khi vẽ đồ thị là:
+ Dùng biểu đồ, đồ thị càng đơn giản càng có hiệu quả.
+ Tất cả các biểu đồ, đồ thị cần đảm bảo yếu tố tự giải thích
+ Tiêu đề có thể đặt ở phía dưới của biểu đồ, đồ thị
+ Khi có nhiều biến số được trình bày trên biểu đồ, đồ thị, thì từng biến số phải được
phân biệt rõ ràng bằng lời chú giải hoặc chú dẫn
+ Không nên sử dụng các trục tọa độ khác khi không cần thiết
+ Đường biểu diễn đồ thị cần đậm hơn các trục tọa độ khác.
+ Tân số luôn luôn đuợc trình bày theo độ chia thăng đứng và phương pháp phân loại
trình bày theo độ chia nằm ngang
+ Đối với độ chia số học, các độ chia bằng nhau đại diện cho các đơn vị tính như nhau
+ Sự phân chia các độ trên biểu đồ, đồ thị cần phải rõ ràng cũng như các đơn vị tính
tương ứng trên nó.
2.2. Biểu đồ
Biểu đồ là phương pháp trình bày số liệu thống kê bằng hình với một hệ tọa độ.
Dưới đây là các loại biểu đồ thường dùng.
2.2.1. Biểu đồ cột (bar chart)
Biểu đồ cột được sử dụng trong các trường hợp sau:
+ So sánh số liệu giữa hai hoặc nhiều nhóm,
+ Mô tả tần số tuyệt đối hoặc tần số tương đối (còn gọi là tỷ lệ)
+ Thể hiện các số đo lường
Trong biểu đồ cột, tần số tuyệt đối hoặc tỷ lệ được thể hiện qua chiều dài các cột
(độ rộng cột là như nhau). Giữa các cột có khoảng trống để nhấn mạnh tính chất không
liên tục của biến số và khoảng cách này là như nhau giữa các cột (không giống như tổ chức
đồ - histogram). Các cột có thể được thể hiện trên trục hoành hoặc trục tung (biểu đồ cột
đứng hoặc cột nằm ngang) với cách thể hiện màu sắc hoặc làm đậm, vạch chéo khác nhau
để phân biệt giữa các cột có ý nghĩa khác nhau. Tốt nhất là nên biểu diễn các cột theo thứ