Giáo trình môn hc: Thng kê sinh hc & Nghiên cu Y hc, NXB Y hc.
Ch biên: u Ngọc Hot (2017) 50
BÀI 4
PHƯƠNG PHÁP THỐNG KÊ Y SINH HC
NI DUNG HC TP
Vic trình bày s liu thu thập đuợc trong nghiên cu là mt công vic hết sc quan
trọng để the hin kết qu ca nghiên cu. s liu sau khi thu thp thung hỗn độn,
vy, mun t các s liu y tính toán các giá tr đặc trưng thc hin các k thut suy
lun thống để rút ra nhng kết lun giá tr, ta phi biết cách sp xếp trình bày s
liu mt cách rõ ràng, gn và có h thng
Hai chiến luc cơ bn giúp chúng ta tiến hành kho sát mt b s liu:
(1). Bắt đầu bng kho sát tng biến. Sau đó chuyển sang nghiên cu mối tuơng
quan gia các biến
(2). Bắt đầu vi mt bng/biểu/đồ th hoc nhiu bng/biểu/đồ thị. Sau đó bổ
sung các s liu tng hp v những đặc trưng c th ca s liu
Chúng ta cn tuân th nhng nguyên tc trong sut quá trình phân tích. Trong
bài hc này, chúng ta s băt đâu băng việc trình bày các bng phân phi tn s, và bng
các biểu đồ, đ th
1. BNG PHÂN PHI TN S
1.1. Tiêu chun ca mt bng tt
Mc không một quy định nào cht ch v vic trình bày s liu bng bng,
nhưng có một vài nguyên tắc chung đươc coi là tiêu chuẩn:
+ Bng càng cần đơn giản càng tt: nên dùng bảng đơn giản để người đọc d hiểu n
bng phc tp vi nhiu biến s. Nhìn chung, mt bng nên ch được lp vi ti
đa là 3 biến s.
+ Bng cn phải đảm bo yếu t t gii thích
MC TIÊU HC TP
1. Lập được kế hoch phân tích và trình bày s liu
2. La chọn được phương pháp thng kê phù hp vi các loi s liu
3. Trình bày được mt b s liu c th i dng các bng, biểu đồ và đồ th thích
hp, và phiên giải được ý nghĩa của s liu trong các bng, biểu, đồ th
Giáo trình môn hc: Thng kê sinh hc & Nghiên cu Y hc, NXB Y hc.
Ch biên: u Ngọc Hot (2017) 51
+ Các mã hóa, ch viết tt hoc biểu tượng cn phi gii thích c th trong phn chú
thích cui trang
+ Cn ghi rõ ràng và chính xác trong tng dòng và tng ct
+ Các đơn vị đo lường c thế cho tng s liu cần được ch
+ Tiêu đề ca bảng cũng cn phải ràng, chính xác đúng trng m. cn tr li
các câu hi: Cái gì? Khi nào? đâu?
+ S tng cng cn phải được trình bày trong bng
+ Tiêu đề ca bng cn phải được phân cách vi ni dung bng bng dòng k hoc
mt khong cách dòng. Trong các bng nh, các dòng k ngang phân cách các dòng
có thế không cn thiết.
+ Nếu s liu trích dn, thì ngun gc, xut x ca s liu cần được ch trong
phn chú thích dưới bng.
1.2. Các loi bng phân phi tn s
1.2.1. Bng phân phi tn s mt chiu
Dùng để trình bày s phân phi ca một đặc tính kho sát
Kho sát cho biến định tính
Bng 2. Phân b trình độ hc vn ca dân s trong độ tui 25-34
Trình độ học vấn
Số lượng
(triệu ngưòi)
Tỷ lệ phần trăm
(%)
Chưa tốt nghiệp THPT
4,6
12,1
Tốt nghiệp THPT
11,6
30,5
Trung cấp
7,4
19,5
Cao đẳng
3,3
8,7
Đại học
8,6
22,6
Sau đại học
2,5
6,6
Giáo trình môn hc: Thng kê sinh hc & Nghiên cu Y hc, NXB Y hc.
Ch biên: u Ngọc Hot (2017) 52
Kho sát cho biến định lượng
Bảng 3. Phân bố chiều cao của 40 thanh niên
Lớp
Ranh giới lớp
(cm)
Giá trị trung
tâm (cm)
Tần số
(n)
Tần số tương
đối (%)
1
150,5 - 153,5
152
1
2,5
2
153,5 - 156,5
155
3
7,5
3
156,5 - 159,5
158
7
17,5
4
159,5 - 162,5
161
9
22,5
5
162,5 - 165,5
164
8
20,5
6
165,5 - 168,5
167
6
15,0
7
168,5 -171,5
170
4
10,0
8
171,5 -174,5
173
2
5,0
Tống
40
100
Trong bng trên, các s liệu đã được phân nhóm thành tng lp:
+ Ct 1: S th t ca lp
+ Ct 2: Ranh gii lp, được xác định sao cho mỗi trường hp kho sát phi thuc
mt lp
+ Ct 3: Giá tr trung tâm giá tr đại din cho mọi trường hp trong lớp, được tính
bng trung bình cng ca ranh giới trên và dưới ca lp
+ Ct 4: S trưng hợp quan sát được trong môi lp, được gi là tn s ca lp
+ Ct 5: Tn s tương đi ca lp t l phần trăm giữa tn s ca lp vi tng s
trưng hp quan sát ( đây 100). Sử dng tn s này ta th thc hiện được
vic so sánh gia các tp hp s liệu đồng dng vi nhau (ví d chiu cao thanh
niên) dù tng s trưng hp quan sát ca mi tp hp khác nhau.
+ Ct 6: Tn s tương đối cng dồn xác định t l phần trăm những thanh niên
chiều cao dưới mt gii hạn nào đó. bng này, 50% thanh niên chiu
cao<162,5 cm
Giáo trình môn hc: Thng kê sinh hc & Nghiên cu Y hc, NXB Y hc.
Ch biên: u Ngọc Hot (2017) 53
1.2.2. Bng phân phi tn s hai chiu (2x2)
Dùng để trình bày s phân phi ca một đặc tính khảo sát tương quan với một đặc
tính khác.
Bng 4. Kết qu xét nghiêm Creatinine Kinase (CK) trên bnh nhân nghi ng mc
nhồi máu cơ tim cp tính
Ket quả test CK
Nhồi máu cơ tim cấp (AMI)
Tổng
Bệnh
Không bệnh
Dương tính (>80IU)
215
16
231
Âm tính (<80IU)
15
114
129
Tổng
230
130
360
Bng 5. Liên quan gia tui - chiu cao ca 100 tr
Chiều cao
(cm)
Tuổi (năm)
Tổng
3-4
5-6
7-8
75-84
15
8
2
25
85-94
10
32
13
55
95-104
0
5
15
20
Tổng
25
45
30
100
1.2.4. Bng gi (bng câm)
Bng gi mt loi bảng đầy đủ tên bảng, các tiêu đề cho cột dòng nhưng
chưa số liu. Bảng này được thiết kế trong giai đoạn lập đ cương nghiên cứu đế cho
nhà nghiên cu có sẵn ý tưởng cho thiết kế và thu thp s liu.
Trình độ học vấn của mẫu
Số lượng (n)
Tỷ lệ (%)
Chưa tốt nghiệp THPT
Tốt nghiệp THPT
Cao đẳng - Đại học
Sau đại học
Tóm tt s liu s được tiến hành và đơn giản hóa bng việc trước hết cn chun b
mt bng tng thế. Trong bng này, tt c các s liu sn có cần được phân loi mt cách
hoàn chnh. Khi vic phân loi s liu hoàn tt, chúng ta có th thu được s liu liên quan
đến biến s đơn hoc tp hp ca các biến s mà không cn phi da vào s liệu ban đầu.
Giáo trình môn hc: Thng kê sinh hc & Nghiên cu Y hc, NXB Y hc.
Ch biên: u Ngọc Hot (2017) 54
2. Biểu đồ đ th
2.1. Nguyên tc chung
Khi biểu đồ, đồ th đã được v mt cách chính xác, người đọc th hiu toàn b
s liu mt cách nhanh chóng. Mt vài nguyên tc quan trng nht khi v đồ th là:
+ Dùng biểu đồ, đ th càng đơn giản càng có hiu qu.
+ Tt c các biểu đồ, đ th cần đảm bo yếu t t gii thích
+ Tiêu đề có th đặt phía dưới ca biểu đồ, đ th
+ Khi có nhiu biến s được trình bày trên biểu đồ, đ th, thì tng biến s phải được
phân bit rõ ràng bng li chú gii hoc chú dn
+ Không nên s dng các trc tọa độ khác khi không cn thiết
+ Đưng biu diễn đồ th cần đậm n các trc tọa độ khác.
+ Tân s luôn luôn đuợc trình bày theo độ chia thăng đứng và phương pháp phân loi
trình bày theo độ chia nm ngang
+ Đối với độ chia s học, các độ chia bằng nhau đi diện cho các đơn v tính như nhau
+ S phân chia các đ trên biểu đồ, đồ th cn phải rõ ràng cũng như các đơn vị tính
tương ứng trên nó.
2.2. Biểu đồ
Biểu đồ phương pháp trình bày s liu thng bng hình vi mt h tọa độ.
ới đây là các loi biểu đồ thưng dùng.
2.2.1. Biểu đồ ct (bar chart)
Biểu đồ cột được s dụng trong các trường hp sau:
+ So sánh s liu gia hai hoc nhiu nhóm,
+ Mô t tn s tuyệt đối hoc tn s tương đối (còn gi là t l)
+ Th hin các s đo lường
Trong biểu đồ ct, tn s tuyệt đối hoc t l được th hin qua chiu dài các ct
rng ct như nhau). Giữa các ct khong trống để nhn mnh tính cht không
liên tc ca biến s khoảng ch này như nhau giữa các ct (không giống như t chc
đồ - histogram). Các ct th được th hin trên trc hoành hoc trc tung (biểu đ ct
đứng hoc ct nm ngang) vi cách th hin màu sc hoặc làm đậm, vch chéo khác nhau
để phân bit gia các cột có ý nghĩa khác nhau. Tt nht là nên biu din các ct theo th