Ứng dụng SPSS 12.0 trong xử lý thống kê: Hướng dẫn chi tiết

Ứng dụng phần mềm SPSS 12.0 trong xử lý thống kê

I/ GIỚI THIỆU CHUNG

1. Sơ lược về phần mềm SPSS

SPSS là tên viết tắt của cụm từ Statistical Package for the Social Sciences. Đây là một phần mềm

được sử dụng rộng dãi nhất để phân tích thống kê trong nghiên cứu khoa học tự nhiên và khoa học

xã hội nói chung. Phiên bản đầu tiên được phát hành năm 1968 do Công ty liên hợp SPSS- Chicago

Mỹ sản xuất. Đến tháng 7 năm 2007 đã có phiên bản thứ 16 (SPSS 16.0)

Môi trường làm việc của SPSS gồm hai phần: phần soạn thảo dữ liệu đầu vào (SPSS Data Editor) và

phần kết quả đầu ra (Output – SPSS Viewer). SPSS Data Editor gồm Data Viewer và Variable

Vierer cho phép nhập số liệu đầu vào trực tiếp hoặc add file số liệu ở dạng Excel.xml, đồng thời định

dạng các biến số theo dạng số (number) hay dạng trữ (String). Output – SPSS Viewer chứa các kết

quả mong muốn sau khi chạy các phép toán tương ứng.

Tương tự như các phần mềm Genstar và Minitab, SPSS 12.0 cho phép sử lý các phép phân tích

thống kê thông thường như:

Descriptive statistics: Cross tabulation (sắp xếp thành bảng, hàng đối xứng nhau);

Frequencies (tần số, tần suất….); Descriptive (mô tả, diễn tả…); Explore (khảo sát tỉ mỉ…);

Descriptive Ratio Statistics (thống kê mô tả tỷ lệ, tỷ số….).

Bivariate statistics (thống kê hai biến số): Means (trung bình); t-test (phép thử, kiểm tra,

phân tích…); ANOVA (phân tích phương sai); Correlation (tương quan) bao gồm bivariate (hai

biến), partial (tương quan từng phần, tương quan không hoàn toàn), distances (tương quan dời dạc,

lỏng lẻo); Nonparametric tests (kiểm tra thông số giới hạn).

Prediction for numerical outcomes: Linear regression (dự đoán về kết quả bằng số dạng hồi

qui tuyến tính…)

Prediction for identifying groups: Factor analysis (phân tích nhân tố); cluster analysis (phân

tích cho đám đông) bao gồm two – step (hai bậc), K-means (số K), hierarchic (có thứ bậc).

SPSS cũng cho phép lưu và chạy lại các thuật toán giúp việc kiểm tra kết quả dễ dàng. Nhưng phần

Output – SPSS Viewer đã được thiết kế tiện lợi hơn cho người sử dụng. Mục này bao gồm các bảng

kết quả (ví dụ như bảng phân tích phương sai, bảng thống kê mô tả….) hay các đồ thị có thể được

thay đổi định dạng trực tiếp cho phù hợp với form của bài viết và có thể copy trực tiếp vào bài viết

2. Cài đặt SPSS 12.0 cho máy tính

- Double click vào biểu tượng Setup.exe trong thư mục SPSS 12.0 để cài đặt.

- Nhấn Next đến khi cửa sổ dưới đây xuất hiện

II/ MỘT SỐ KIỂU THIẾT KẾ THÍ NGHIỆM VÀ ỨNG DỤNG SPSS ĐỂ SỬ LÝ SỐ LIỆU

2.1. Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn (CRD – Completely

Randomised Design)

Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn có nghĩa là các nghiệm thức được phân vào các

đơn vị thí nghiệm một cách hoàn toàn ngẫu nhiên, hay mỗi đơn vị thí nghiệm có một cơ hội giống

nhau để được tiếp nhận một nghiệm thức.

Thiết kế thí nghiệm theo kiểu này rất hiệu quả trong trường hợp các đơn vị thí nghiệm đồng đều

nhau và ngược lại sẽ không hiệu quả nếu các đơn vị thí nghiệm không đồng nhất. Bao gồm thiết kế

thí nghiệm ngẫu nhiên hoàn toàn một nhân tố và thiết kế thí nghiệm ngẫu nhiên hoàn toàn đa nhân

tố. Các nhân tố trong thí nghiệm có thể chỉ có nhân tố định tính hoặc định lượng hoặc bao gồm cả

hai. Trong các nhân tố thí nghiệm lại có thể có nhiều mức nhân tố. Thí nghiệm một nhân tố cung cấp

thông tinh về ảnh hưởng chính chỉ của một nhân tố thí nghiệm. Thí nghiệm đa nhân tố Có hai hoặc

nhiều hơn nhân tố được nghiên cứu đồng thời. Có hiệu quả hơn so với tiến hành từng thí nghiệm

riêng lẻ và cung cấp thông tin về ảnh hưởng chính và ảnh hưởng của tương tác giữa các nhân tố.

- Mở fine Licence 12.0SPSS để copy dòng số

55345 26752 51345 33006 86803 93573 71895 65752 87

sau đó paste vào ô Licence code.

- Click Update để tiếp tục cài cặt.

- Nhấn Next/Next/Install quá trình cài đặt mất vài phút, nhấn Finish để hoàn tất cài đặt.

Note:

+ Nếu quá trình cài đặt báo lỗi thì có thể phải gỡ bỏ các chương trình Anti virut thường không tương thích

với SPSS 12.0 (AVG, Noton….), sau khi cài đặt SPSS hoàn tất có thể cài đặt lại các chương trình Anti

virut này.

+ Vào Start/ Program để đưa biểu tượng của SPSS 12.0 SPSS 12.0 for Windows.lnk ra màn hình, để tiện lợi

cho việc sử dụng.

* Mô hình ANOVA một nhân tố

yij=μ+Ai+eij

– yij: Giá trị của biến phụ thuộc của con vật j trong nghiệm thức i (i=1,…a; j=1,…n)

– i chỉ số mức của nhân tố, j chỉ số lần lặp lại

– μ: Là trung bình tổng thể

– Ai: Là ảnh hưởng cố định hoặc ngẫu nhiên của nhân tố nghiên cứu với mức i

– eij: Là hiệu dư, IID N(0,σ2), independent identically distributed

1. Tình huống 1: Nghiên cứu ảnh hưởng của 3 mức protein 14%; 17%; 18% trong khẩu phần đến

tăng trọng của lợn lai F1 (MC x ĐM) trong giai đoạn sinh trưởng. Có 24 ô chuồng và 24 con lợn.

Các con lợn này tương đồng về các yếu tố tuổi tác, trọng lượng…

a. Phân tích tình huống

- Nhân tố thí nghiệm: 1 nhân tố, là mức protein.

- Mức nhân tố: 3 mức (14% pro, 17% pro, 18% pro)

- Kiểu thiết kế thí nghiệm: ngẫu nhiên hoàn toàn.

- Đơn vị thí nghiệm: mỗi cá thể lợn.

- Số lần lặp lại: 24/3 = 8 lần.

b.Thiết kế thí nghiệm (bằng Excel)

- B1: Liệt kê danh sách các ô chuồng tương ứng cho từng cá thể lợn thí nghiệm (ochuong)

– B2: Dùng hàm RAND() trong EXCEL để gán các con số ngẫu nhiên cho các ô chuồng (Rand1)

sau đó copy và past special các con số này tại đúng vị trí ấy.

– B3: Dùng hàm SORT trong thẻ DATA, có thể dùng ascending hay descending, SORT theo số

ngẫu nhiên vừa mới tạo (Rand1), chú ý bao gồm cả số ô chuồng (ochuong)

– B4: Liệt kê các mức protein theo thứ tự 18%, 17%, 14%; 18%, 17%, 14%;..ho ặc ngược lại. Đồng

thời tạo số ngẫu nhiên thứ 2 (Rand 2).

– B5: SORT lần thứ 2 theo cột vùng chứa 2 cột mức protein (muc protein) và số ngẫu nhiên 2

(Rand 2).

– B6: SORT theo cột vùng chứa 2 cột ochuong và muc protein.

B¶ng 1

B¶ng tãm t¾t AN

OVA trong thí nghiệm kiểu CRD với 1 nhân tố

Nguån biÕn ®éng df MS F

Gi÷a c¸c nhãm/

nhân

tố thí nghiệm

a-1 MS

/MS

Trong c¸c nhãm a(n-1) MS

Tæng an-1

Hình1: Thiết kế thí nghiệm ngẫu nhiên hoàn toàn một nhân tố bằng Excel

Kết quả thiết kế:

Các mức protein được phân chia hoàn toàn ngẫu nhiên vào các cá thể lợn như sau:

– Mức protein 14% được phân chia vào các ô chuồng: 3; 7; 11; 19; 20; 22; 23; 24.

– Mức protein 17% được phân chia vào các ô chuồng: 5; 6; 13; 15; 16; 17; 18; 21.

– Mức protein 18% được phân chia vào các ô chuồng còn lại: 1; 2; 4; 8; 9; 10; 12; 14.

Chú ý: Về cách thiết kế thí nghiệm trên:

Cách làm như trên gọi là Double randomization tuy nhiên, theo tài liệu Design of Experiments:

Statistical Principles of Research Design and Analysis (Kuehl, 2000), thì ở bước thứ 4 có thể trực

tiếp phân các mức protein vào các ô chuồng, 18, 18…18; 17, 17…17; 14, 14…14. Cách làm như

vậy còn gọi là Single randomization

c. Nhập kết quả và xử lý bằng SPSS

* Nhập số liệu:

Giả sử kết quả tăng trọng (kg/tháng) trong thí nghiệm thu được như sau:

Như vậy, số liệu thí nghiệm sẽ được nhập theo cột tương ứng với từng mức protein trong Excel. Sau

đó file này được sử dụng để chạy bằng SPSS.

* Xử lý bằng SPSS

- Phân tích thống kê

Chọn thẻ Analyze/ Descriptive Statistics, sau đó tùy theo từng thí nghiệm và mục đích phân tích

thống kê để chọn các thẻ khác nhau. Frequencies cho phân tích theo tần số, tấn suất; Descriptives

cho phân tích mô tả; Exprore cho phân tích mô tả chi tiết; Ratio cho phân tích theo tỷ lệ, tỷ số.

Trong tình huống này, phép phân tích mô tả chi tiết cho biết thông tin đầy đủ nhất. Chọn Analyze/

Descriptive Statistic/ Exprore hộp thoại Exprore xuất hiện như sau:

Mức protein (%)

Cá thể

14%

17%

18%

Ứng dụng phần mềm SPSS 12.0 trong xử lý thống kê

Chủ đề:

Tài liệu liên quan

Tài liêu mới

Xác nhận đăng nhập

Đăng nhập từ tài khoản này?

AI tóm tắt

Giới thiệu tài liệu

Đối tượng sử dụng

Từ khoá chính

Nội dung tóm tắt

Hỗ trợ

Phương thức thanh toán

Theo dõi chúng tôi