
TKYH: Nguyên lý kiểm định Thái Thanh Trúc 1
(Version 1: 30/08/2015 11:56:28 AM)
BÀI 3: NGUYÊN LÝ KIỂM ĐỊNH
Mục tiêu học tập
Sau khi hoàn thành bài học này, học viên có thể:
- Trình bày được khái niệm về kiểm định giả thuyết
- Trình bày được qui trình thực hiện kiểm định giả thuyết
- Trình bày được khái niệm sai lầm loại 1, loại 2, sức mạnh thống kê
- Chọn lựa được kiểm định thống kê tương ứng với giả thuyết thống kê
- Lý giải được giá trị p trong kiểm định giả thuyết
1. Khái niệm kiểm định giả thuyết
Nghiên cứu khoa học là một quá trình thu thập, phân tích và lý giải dữ liệu để trả lời
một hoặc nhiều câu hỏi, giả thuyết đặt ra ban đầu xuất phát từ tính tò mò và nhu cầu về kiến
thức và sự tự cảm nhận. Một nghiên cứu sẽ thu được kết quả và kết luận hoàn toàn chính xác
nếu như nhà nghiên cứu có thể lấy được dữ liệu của toàn bộ quần thể đối tượng đích (hay còn
gọi là dân số). Tuy nhiên, vì tính khả thi và nguồn lực thường bị hạn chế nên trong thực tế nhà
nghiên cứu không thể nào tiến hành nghiên cứu trên toàn bộ quần thể đích mà chỉ có thể tiến
hành trên một nhóm nhỏ hơn, gọi là mẫu nghiên cứu. Từ mẫu nghiên cứu và những kết quả
phân tích dữ liệu trên mẫu, nhà nghiên cứu ngoài mong muốn trả lời thắc mắc trước nghiên
cứu còn mong muốn suy diễn rộng hơn để biết được nhiều hơn về con số thật sự trong dân số,
bao gồm cả những người đã tham gia hoặc không tham gia vào nghiên cứu. Hay nói cách khác,
nhà nghiên cứu sử dụng con số của mẫu để mô tả con số thật sự của dân số.
Theo thuyết giới hạn trung tâm (Central Limit Theorem) thì nếu chúng ta tiến hành
nghiên cứu nhiều lần và nhiều lần chọn mẫu trên dân số đích, thì các con số ước lượng (ví dụ:
trung bình, tỉ lệ…) của các mẫu sẽ có phân phối bình thường. Chẳng hạn, vì không thể nào đo
chiều cao của khoảng 8 triệu người trưởng thành tại Thành phố Hồ Chí Minh (TP.HCM) để trả
lời câu hỏi về chiều cao trung bình của nhóm người này là bao nhiêu, nên có nhiều nghiên cứu
được tiến hành trên các mẫu nhỏ hơn với sự tham gia từ vài trăm cho đến vài ngàn người. Ứng
với mỗi nghiên cứu đó, nhà nghiên cứu sẽ có được trung bình chiều cao trên mẫu nghiên cứu
của họ. Trong trường hợp này, các giá trị trung bình báo cáo từ các nghiên cứu (cùng trên quần
thể là người trưởng thành tại TP.HCM) sẽ có phân phối bình thường. Nếu có 100 nghiên cứu

TKYH: Nguyên lý kiểm định Thái Thanh Trúc 2
(Version 1: 30/08/2015 11:56:28 AM)
thì 100 giá trị trung bình chiều cao sẽ có phân phối bình thường và bình quân các giá trị trung
bình của 100 nghiên cứu sẽ bằng với trung bình của dân số đích (tất cả người trưởng thành tại
TP.HCM).
Nếu như giá trị trung bình của dân số là con số thực và đúng đắn thì khi giá trị trung
bình mẫu khác biệt nhiều so với giá trị của dân số sẽ nói lên rằng rất ít khả năng nhà nghiên
cứu có được một mẫu như thế từ dân số đích (nhưng thực tế nhà nghiên cứu đã có). Ví dụ,
chiều cao trung bình của toàn bộ người trưởng thành tại TP.HCM là 160 cm và một nghiên cứu
tiến hành cho kết quả chiều cao trung bình là 180 cm. Sự khác biệt lớn cho thấy khó có khả
năng mẫu này được lấy từ dân số những người trưởng thành tại TP.HCM và/hoặc phải có điều
gì đó đặc biệt trong mẫu nghiên cứu này. (Bật mí: nghiên cứu này tiến hành đo chiều cao trung
bình ở người trưởng thành tại TP.HCM bằng cách lấy mẫu tại một trường thể dục thể thao và
ngẫu nhiên lại trùng vào thời điểm đội tuyển bóng rổ vừa học xong). Trong trường hợp này,
nhà nghiên cứu cần tìm hiểu lại tính hợp lý, đại diện của mẫu nghiên cứu so với dân số đích.
Ngược lại, trong trường hợp trung bình mẫu khác biệt ít so với trung bình dân số thì nhiều khả
năng mẫu mà nhà nghiên cứu đã chọn phù hợp với dân số đích và dĩ nhiên tính suy diễn sẽ tốt
hơn so với trường hợp bên trên.
Hình 3.1 thể hiện chiều cao dân số của người Việt trưởng thành tại TP.HCM. Khi đó,
nếu chiều cao của dân số thật sự là 160 cm thì trong nhiều nghiên cứu trên nhiều mẫu sẽ có
trung bình chiều cao các mẫu có phân phối như hình 3.1 bên dưới. Sử dụng qui luật của phân
phối chuẩn, chúng ta biết rằng có 95% các nghiên cứu lấy mẫu từ dân số này sẽ cho kết quả
trung bình chiều cao nằm trong khoảng hai độ lệch chuẩn quanh giá trị trung bình dân số này.
Sẽ rất ít có khả năng chúng ta lấy mẫu từ dân số này và cho kết quả trung bình chiều cao ngoài
ngưỡng 2 độ lệch chuẩn. Trong trường hợp đó hoặc con số được gọi là trung bình dân số không
chính xác hoặc mẫu nghiên cứu có vấn đề cần xem xét.

TKYH: Nguyên lý kiểm định Thái Thanh Trúc 3
(Version 1: 30/08/2015 11:56:28 AM)
Hình 3.1: Dữ liệu của nhiều nghiên cứu trên cùng dân số đích có phân phối bình thường
với trung bình là giá trị thật sự của dân số.
Các con số thống kê mô tả thường dùng để trình bày và tóm tắt dữ liệu để từ đó có thể
đưa ra các quyết định hay kết luận cho một báo cáo khoa học hoặc một khuyến nghị cho các
cơ quan, đối tượng. Tuy nhiên, có khả năng những kết quả hay kết luận đó chỉ là do sự trùng
hợp tình cờ mà không phải là kết quả hay kết luận đại diện thật sự cho dân số. Khả năng này
xảy ra khi một thử nghiệm, nghiên cứu khác hoàn toàn tương tự được lặp lại nhưng kết luận lại
khác đi. Vì vậy, điều cần thiết trong các nghiên cứu là việc sử dụng các phương pháp thống kê
phân tích để đánh giá xem các phát hiện trong nghiên cứu là do ngẫu nhiên và tình cờ trùng
hợp hay thật sự là kết quả phù hợp và đại diện cho quần thể nghiên cứu. Một trong những công
cụ có thể làm được điều này là các kiểm định giả thuyết thống kê dạng suy luận và là nội dung
cơ bản của cái gọi là “giá trị p” hay “p value”.
Theo nghĩa đen, kiểm định giả thuyết hay kiểm định thống kê là quá trình tính toán qua
nhiều bước nhằm chứng minh giả thuyết đúng hay không đúng, phù hợp hay không phù hợp.
Kiểm định giả thuyết ngoài việc có thể cho biết kết quả trong mẫu nghiên cứu có giống hay
khác so với quần thể đích mà còn có thể dùng để so sánh sự giống, khác, lớn hơn, nhỏ hơn của
hai quần thể với nhau và/hoặc hai mẫu với nhau. Quay lại với ví dụ về chiều cao trung bình
của toàn bộ người trưởng thành tại TP.HCM, một nghiên cứu tiến hành chọn ngẫu nhiên 2000
người tại khắp các quận huyện. Khi có dữ liệu, nhà nghiên cứu có thể so sánh với giá trị của
dân số (160 cm) để xem kết quả nghiên cứu của mình có phù hợp hay không. Ngoài ra, nhà
nghiên cứu cũng có thể so sánh chiều cao trung bình giữa nam giới và nữ giới trong số 2000
người đã tham gia nghiên cứu. Ở đây, có thể xem nam giới và nữ giới là hai nhóm dân số hoặc
hai mẫu khác nhau và kiểm định giả thuyết sẽ vẫn có thể ứng dụng trong trường hợp này. Nếu
dùng kết quả nghiên cứu của mình để so sánh với con số của dân số hoặc con số của nghiên
cứu khác thì được gọi là kiểm định giả thuyết một mẫu. Nếu so sánh các nhóm trong nghiên
cứu với nhau và/hoặc các dân số với nhau thì được gọi là kiểm định nhiều mẫu.
2. Qui trình thực hiện kiểm định thống kê
Kiểm định giả thuyết giúp suy luận độ phù hợp của mẫu so với dân số hoặc độ phù hợp
giữa các mẫu/dân số và là một qui trình trong đó bao gồm một loạt các bước có liên hệ chặt
chẽ với nhau. Trong phương pháp này, chúng ta sẽ kiểm định giả thuyết bằng cách xác định độ
khả dĩ (nói nôm na là khả năng) con số thống kê của mẫu có thể xảy ra nếu như giả thuyết về

TKYH: Nguyên lý kiểm định Thái Thanh Trúc 4
(Version 1: 30/08/2015 11:56:28 AM)
con số của dân số là đúng. Một số tác giả gợi ý rất nhiều bước bằng cách chia nhỏ qui trình
thực hiện nhưng về cơ bản để thực hiện một kiểm định thống kê thường cần trải qua 5 bước:
- Xác định giả thuyết thống kê và ngưỡng ý nghĩa
- Chọn lựa kiểm định phù hợp
- Tính chỉ số thống kê tương ứng
- Tính xác xuất
- Kết luận
Năm bước này có “liên đới trách nhiệm” với nhau vì sai sót của một bước sẽ dẫn đến
các sai sót của những bước sau đó. Ví dụ, ứng với một giả thuyết mà lựa chọn con số hoặc
phương pháp thống kê sai sẽ dẫn đến giá trị p bị sai và đưa ra kết luận không phù hợp. Ngày
nay, với sự hỗ trợ của các phần mềm thống kê thì bước thứ 3 (tính chỉ số thống kê) và 4 (tính
xác suất) ít bị sai sót hơn nhưng dễ bị quên hơn. Một số nhà nghiên cứu sẽ chỉ quan tâm đến
giả thuyết, chọn kiểm định, bấm lên phần mềm và kết luận. Vì vậy, chúng ta nên tiến hành cả
năm bước trong giai đoạn làm quen ban đầu có cái nhìn và hiểu biết một cách có hệ thống về
kiểm định giả thuyết thống kê.
2.1. Xác định giả thuyết thống kê và ngưỡng ý nghĩa
Giả thuyết thống kê hay còn gọi là giả thuyết không (null hypothesis, ký hiệu là H0)
trong đó giả định thường đặt ra là giá trị của dân số là đúng và con số của mẫu tương đồng với
con số của dân số. Nếu là kiểm định giả thuyết trên hai mẫu/dân số thì giả thuyết H0 giả định
rằng giá trị của hai mẫu/dân số là tương đồng. Hay nói cách khác, giả thuyết H0 là một giả
thuyết âm tính hoặc trung tính, xem như không khác biệt, không liên quan, không tương quan.
Giả thuyết H0 trong thống kê cũng tương tự việc giả định vô tội trong các phiên tòa xét xử mà
khi đó quan tòa phải mặc định ban đầu rằng bị cáo là người vô tội rồi sau đó mới chứng minh
điều này là đúng hay sai. Công tố viên của viện kiểm sát và luật sư bào chữa cho bị cáo có vai
trò giống nhà nghiên cứu và/hoặc nhà phân tích thống kê. Thông thường, nếu không có bằng
chứng vững chắc thì quan tòa sẽ phóng thích bị cáo hơn là cho một người vô tội đi tù (đặc biệt
là thời gian gần đây luật bồi thường phát huy tác dụng). Chính vì vậy, nhà nghiên cứu khi
không có bằng chứng chắc chắn sẽ cần phải chấp nhận những kiến thức, thông tin được cho là
đúng trước đây để làm giả thuyết hơn là sử dụng một giả thuyết sai. Vì lý do này, chúng ta cần
mặc định rằng giả thuyết H0 là đúng và đi chứng minh khả năng nó đúng hay không đúng.

TKYH: Nguyên lý kiểm định Thái Thanh Trúc 5
(Version 1: 30/08/2015 11:56:28 AM)
Cần lưu ý rằng giả thuyết không (H0) đôi khi khác với giả thuyết nghiên cứu. Ví dụ,
nhà nghiên cứu muốn chứng minh rằng chiều cao của nam hơn nữ hoặc giới tính có liên quan
đến chiều cao. Khi đó giả thuyết nghiên cứu đặt ra ban đầu có thể là: 1) Chiều cao của nam
giới trưởng thành tại TP.HCM hơn nữ giới hoặc 2) Giới tính có mối liên quan với chiều cao ở
người trưởng thành tại TP.HCM. Tuy nhiên, khi đã có dữ liệu và tiến hành kiểm định giả thuyết
này thì giả thuyết thống kê H0 phải là giả thuyết âm tính hoặc trung tính và có thể là: 1) Trung
bình chiều cao của nam giới trưởng thành tại TP.HCM tương đương nữ giới hoặc 2) Trung
bình chiều cao của nam giới trưởng thành tại TP.HCM không khác biệt so với nữ giới hoặc 3)
Không có mối liên quan giữa giới tính và chiều cao ở người trưởng thành tại TP.HCM. Có thể
thấy rằng giả thuyết nghiên cứu là một câu trả lời tạm thời cho câu hỏi nghiên cứu và giả thuyết
thống kê (H0) phải là một phát biểu âm tính hoặc trung tính và là một bước trong quá trình giả
định tính toán.
Để có thể hiểu rõ hơn về giả thuyết nghiên cứu và giả thuyết thống kê, chúng ta hãy
quay lại ví dụ về quan tòa xử án. Khi bắt được thủ phạm của một vụ giết người, tất cả những
người liên quan như người dân, cảnh sát điều tra, kiểm sát viên và kể cả quan tòa đều muốn
đưa thủ phạm ra để “kết án”. Kết án ở đây có nghĩa là mọi người đều biết người này có tội và
việc có tội được xem là một câu trả lời tạm thời trong trường hợp này (giả thuyết nghiên cứu).
Tuy nhiên, khi “thăng đường xử án” thì quan tòa luôn giả định thủ phạm/bị cáo không có tội
(giả thuyết thống kê) và rồi các bằng chứng (trong thống kê thì đó là các con số thống kê) sẽ
giúp quan tòa xem giả định vô tội của mình có chấp nhận được hay không.
Giả thuyết H0 là một phát biểu về tham số của dân số trong đó giả định tham số này là
đúng. Giả thuyết H0 là điểm khởi đầu để từ đó chúng ta quyết định xem khả năng xảy ra nhiều
hay ít và từ đó kết luận đúng hay không. Cần lưu ý rằng lý do duy nhất mà chúng ta tiến hành
kiểm định giả thuyết là bởi vì chúng ta nghĩ giả thuyết có thể bị sai. Trong kiểm định giả thuyết
còn có giả thuyết thay thế (alternative hypothesis), hay còn gọi là giả thuyết H1 (hoặc Ha). H1
(Ha) là một phát biểu ngược lại với giả thuyết H0 trong đó thể hiện tham số thật sự của dân số
thấp hơn, cao hơn hoặc không bằng so với giá trị đã nêu trong giả thuyết H0. Hay nói cách
khác giả thuyết H1 (Ha) là điều mà chúng ta nghĩ giả thuyết H0 bị sai. Nếu giả thuyết H0 thể
hiện chiều cao trung bình của người trưởng thành tại TP.HCM trong nghiên cứu không khác
so với dân số (160 cm) thì giả thuyết H1 (Ha) có thể là 1) chiều cao trung bình của người trưởng
thành tại TP.HCM trong nghiên cứu có khác biệt so với dân số hoặc 2) chiều cao trung bình
của người trưởng thành tại TP.HCM trong nghiên cứu nhỏ hơn so với dân số hoặc 3) chiều
cao trung bình của người trưởng thành tại TP.HCM trong nghiên cứu lớn hơn so với dân số.

