
1
Ứng dụng phần mềm SPSS 12.0 trong xử lý thống kê
I/ GIỚI THIỆU CHUNG
1. Sơ lược về phần mềm SPSS
SPSS là tên viết tắt của cụm từ Statistical Package for the Social Sciences. Đây là một phần mềm
được sử dụng rộng dãi nhất để phân tích thống kê trong nghiên cứu khoa học tự nhiên và khoa học
xã hội nói chung. Phiên bản đầu tiên được phát hành năm 1968 do Công ty liên hợp SPSS- Chicago
Mỹ sản xuất. Đến tháng 7 năm 2007 đã có phiên bản thứ 16 (SPSS 16.0)
Môi trường làm việc của SPSS gồm hai phần: phần soạn thảo dữ liệu đầu vào (SPSS Data Editor) và
phần kết quả đầu ra (Output – SPSS Viewer). SPSS Data Editor gồm Data Viewer và Variable
Vierer cho phép nhập số liệu đầu vào trực tiếp hoặc add file số liệu ở dạng Excel.xml, đồng thời định
dạng các biến số theo dạng số (number) hay dạng trữ (String). Output – SPSS Viewer chứa các kết
quả mong muốn sau khi chạy các phép toán tương ứng.
Tương tự như các phần mềm Genstar và Minitab, SPSS 12.0 cho phép sử lý các phép phân tích
thống kê thông thường như:
Descriptive statistics: Cross tabulation (sắp xếp thành bảng, hàng đối xứng nhau);
Frequencies (tần số, tần suất….); Descriptive (mô tả, diễn tả…); Explore (khảo sát tỉ mỉ…);
Descriptive Ratio Statistics (thống kê mô tả tỷ lệ, tỷ số….).
Bivariate statistics (thống kê hai biến số): Means (trung bình); t-test (phép thử, kiểm tra,
phân tích…); ANOVA (phân tích phương sai); Correlation (tương quan) bao gồm bivariate (hai
biến), partial (tương quan từng phần, tương quan không hoàn toàn), distances (tương quan dời dạc,
lỏng lẻo); Nonparametric tests (kiểm tra thông số giới hạn).
Prediction for numerical outcomes: Linear regression (dự đoán về kết quả bằng số dạng hồi
qui tuyến tính…)
Prediction for identifying groups: Factor analysis (phân tích nhân tố); cluster analysis (phân
tích cho đám đông) bao gồm two – step (hai bậc), K-means (số K), hierarchic (có thứ bậc).
SPSS cũng cho phép lưu và chạy lại các thuật toán giúp việc kiểm tra kết quả dễ dàng. Nhưng phần
Output – SPSS Viewer đã được thiết kế tiện lợi hơn cho người sử dụng. Mục này bao gồm các bảng
kết quả (ví dụ như bảng phân tích phương sai, bảng thống kê mô tả….) hay các đồ thị có thể được
thay đổi định dạng trực tiếp cho phù hợp với form của bài viết và có thể copy trực tiếp vào bài viết
2. Cài đặt SPSS 12.0 cho máy tính
- Double click vào biểu tượng Setup.exe trong thư mục SPSS 12.0 để cài đặt.
- Nhấn Next đến khi cửa sổ dưới đây xuất hiện

2
II/ MỘT SỐ KIỂU THIẾT KẾ THÍ NGHIỆM VÀ ỨNG DỤNG SPSS ĐỂ SỬ LÝ SỐ LIỆU
2.1. Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn (CRD – Completely
Randomised Design)
Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn có nghĩa là các nghiệm thức được phân vào các
đơn vị thí nghiệm một cách hoàn toàn ngẫu nhiên, hay mỗi đơn vị thí nghiệm có một cơ hội giống
nhau để được tiếp nhận một nghiệm thức.
Thiết kế thí nghiệm theo kiểu này rất hiệu quả trong trường hợp các đơn vị thí nghiệm đồng đều
nhau và ngược lại sẽ không hiệu quả nếu các đơn vị thí nghiệm không đồng nhất. Bao gồm thiết kế
thí nghiệm ngẫu nhiên hoàn toàn một nhân tố và thiết kế thí nghiệm ngẫu nhiên hoàn toàn đa nhân
tố. Các nhân tố trong thí nghiệm có thể chỉ có nhân tố định tính hoặc định lượng hoặc bao gồm cả
hai. Trong các nhân tố thí nghiệm lại có thể có nhiều mức nhân tố. Thí nghiệm một nhân tố cung cấp
thông tinh về ảnh hưởng chính chỉ của một nhân tố thí nghiệm. Thí nghiệm đa nhân tố Có hai hoặc
nhiều hơn nhân tố được nghiên cứu đồng thời. Có hiệu quả hơn so với tiến hành từng thí nghiệm
riêng lẻ và cung cấp thông tin về ảnh hưởng chính và ảnh hưởng của tương tác giữa các nhân tố.
- Mở fine Licence 12.0SPSS để copy dòng số
55345 26752 51345 33006 86803 93573 71895 65752 87
sau đó paste vào ô Licence code.
- Click Update để tiếp tục cài cặt.
- Nhấn Next/Next/Install quá trình cài đặt mất vài phút, nhấn Finish để hoàn tất cài đặt.
Note:
+ Nếu quá trình cài đặt báo lỗi thì có thể phải gỡ bỏ các chương trình Anti virut thường không tương thích
với SPSS 12.0 (AVG, Noton….), sau khi cài đặt SPSS hoàn tất có thể cài đặt lại các chương trình Anti
virut này.
+ Vào Start/ Program để đưa biểu tượng của SPSS 12.0 SPSS 12.0 for Windows.lnk ra màn hình, để tiện lợi
cho việc sử dụng.

3
* Mô hình ANOVA một nhân tố
yij=μ+Ai+eij
– yij: Giá trị của biến phụ thuộc của con vật j trong nghiệm thức i (i=1,…a; j=1,…n)
– i chỉ số mức của nhân tố, j chỉ số lần lặp lại
– μ: Là trung bình tổng thể
– Ai: Là ảnh hưởng cố định hoặc ngẫu nhiên của nhân tố nghiên cứu với mức i
– eij: Là hiệu dư, IID N(0,σ2), independent identically distributed
1. Tình huống 1: Nghiên cứu ảnh hưởng của 3 mức protein 14%; 17%; 18% trong khẩu phần đến
tăng trọng của lợn lai F1 (MC x ĐM) trong giai đoạn sinh trưởng. Có 24 ô chuồng và 24 con lợn.
Các con lợn này tương đồng về các yếu tố tuổi tác, trọng lượng…
a. Phân tích tình huống
- Nhân tố thí nghiệm: 1 nhân tố, là mức protein.
- Mức nhân tố: 3 mức (14% pro, 17% pro, 18% pro)
- Kiểu thiết kế thí nghiệm: ngẫu nhiên hoàn toàn.
- Đơn vị thí nghiệm: mỗi cá thể lợn.
- Số lần lặp lại: 24/3 = 8 lần.
b.Thiết kế thí nghiệm (bằng Excel)
- B1: Liệt kê danh sách các ô chuồng tương ứng cho từng cá thể lợn thí nghiệm (ochuong)
– B2: Dùng hàm RAND() trong EXCEL để gán các con số ngẫu nhiên cho các ô chuồng (Rand1)
sau đó copy và past special các con số này tại đúng vị trí ấy.
– B3: Dùng hàm SORT trong thẻ DATA, có thể dùng ascending hay descending, SORT theo số
ngẫu nhiên vừa mới tạo (Rand1), chú ý bao gồm cả số ô chuồng (ochuong)
– B4: Liệt kê các mức protein theo thứ tự 18%, 17%, 14%; 18%, 17%, 14%;..ho ặc ngược lại. Đồng
thời tạo số ngẫu nhiên thứ 2 (Rand 2).
– B5: SORT lần thứ 2 theo cột vùng chứa 2 cột mức protein (muc protein) và số ngẫu nhiên 2
(Rand 2).
– B6: SORT theo cột vùng chứa 2 cột ochuong và muc protein.
B¶ng 1
.
B¶ng tãm t¾t AN
OVA trong thí nghiệm kiểu CRD với 1 nhân tố
Nguån biÕn ®éng df MS F
Gi÷a c¸c nhãm/
nhân
tố thí nghiệm
a-1 MS
T
MS
T
/MS
E
Trong c¸c nhãm a(n-1) MS
E
Tæng an-1

4
Hình1: Thiết kế thí nghiệm ngẫu nhiên hoàn toàn một nhân tố bằng Excel
Kết quả thiết kế:
Các mức protein được phân chia hoàn toàn ngẫu nhiên vào các cá thể lợn như sau:
– Mức protein 14% được phân chia vào các ô chuồng: 3; 7; 11; 19; 20; 22; 23; 24.
– Mức protein 17% được phân chia vào các ô chuồng: 5; 6; 13; 15; 16; 17; 18; 21.
– Mức protein 18% được phân chia vào các ô chuồng còn lại: 1; 2; 4; 8; 9; 10; 12; 14.
Chú ý: Về cách thiết kế thí nghiệm trên:
Cách làm như trên gọi là Double randomization tuy nhiên, theo tài liệu Design of Experiments:
Statistical Principles of Research Design and Analysis (Kuehl, 2000), thì ở bước thứ 4 có thể trực
tiếp phân các mức protein vào các ô chuồng, 18, 18…18; 17, 17…17; 14, 14…14. Cách làm như
vậy còn gọi là Single randomization
c. Nhập kết quả và xử lý bằng SPSS
* Nhập số liệu:
Giả sử kết quả tăng trọng (kg/tháng) trong thí nghiệm thu được như sau:

5
Như vậy, số liệu thí nghiệm sẽ được nhập theo cột tương ứng với từng mức protein trong Excel. Sau
đó file này được sử dụng để chạy bằng SPSS.
* Xử lý bằng SPSS
- Phân tích thống kê
Chọn thẻ Analyze/ Descriptive Statistics, sau đó tùy theo từng thí nghiệm và mục đích phân tích
thống kê để chọn các thẻ khác nhau. Frequencies cho phân tích theo tần số, tấn suất; Descriptives
cho phân tích mô tả; Exprore cho phân tích mô tả chi tiết; Ratio cho phân tích theo tỷ lệ, tỷ số.
Trong tình huống này, phép phân tích mô tả chi tiết cho biết thông tin đầy đủ nhất. Chọn Analyze/
Descriptive Statistic/ Exprore hộp thoại Exprore xuất hiện như sau:
Mức protein (%)
Cá thể
14%
17%
18%
1
11
15
13
2
3
14
14
3
6
10
6
4
10
12
10
5
7
12
12
6
8
6
12
7
9
9
16
8
2
10
13

