1
ng dng phn mm SPSS 12.0 trong x lý thng kê
I/ GII THIU CHUNG
1. Sơ lược v phn mm SPSS
SPSS là tên viết tt ca cm t Statistical Package for the Social Sciences. Đây là mt phn mm
được s dng rng dãi nht để phân ch thng kê trong nghiên cu khoa hc t nhiên và khoa hc
hi nói chung. Phiên bn đầu tiên được phát hành năm 1968 do Công ty ln hp SPSS- Chicago
M sn xut. Đến tháng 7 năm 2007 đã có phiên bn th 16 (SPSS 16.0)
Môi trườngm vic ca SPSS gm hai phn: phn son tho d liu đầu vào (SPSS Data Editor) và
phn kết qu đầu ra (Output SPSS Viewer). SPSS Data Editor gm Data Viewer Variable
Vierer cho phép nhp s liu đầu vào trc tiếp hoc add file s liu dng Excel.xml, đồng thi định
dng các biến s theo dng s (number) hay dng tr (String). Output SPSS Viewer cha các kết
qu mong mun sau khi chy các phép toán tương ng.
Tương t như các phn mm Genstar Minitab, SPSS 12.0 cho phép s các phép phân tích
thng kê thông thường như:
Descriptive statistics: Cross tabulation (sp xếp thành bng, hàng đối xng nhau);
Frequencies (tn s, tn sut….); Descriptive ( t, din t…); Explore (kho sát t m…);
Descriptive Ratio Statistics (thng kê mô t t l, t s….).
Bivariate statistics (thng hai biến s): Means (trung bình); t-test (phép th, kim tra,
phân tích…); ANOVA (phân tích phương sai); Correlation (tương quan) bao gm bivariate (hai
biến), partial (tương quan tng phn, tương quan không hoàn toàn), distances (tương quan di dc,
lng lo); Nonparametric tests (kim tra thông s gii hn).
Prediction for numerical outcomes: Linear regression (d đoán v kết qu bng s dng hi
qui tuyến tính…)
Prediction for identifying groups: Factor analysis (phân tích nhân t); cluster analysis (phân
ch cho đám đông) bao gm two – step (hai bc), K-means (s K), hierarchic (có th bc).
SPSS cũng cho phép lưu chy li các thut toán giúp vic kim tra kết qu d dàng. Nhưng phn
Output SPSS Viewer đã được thiết kế tin li hơn cho người s dng. Mc này bao gm các bng
kết qu ( d như bng phân tích phương sai, bng thng mô t….) hay c đồ th th được
thay đổi định dng trc tiếp cho phù hp vi form ca bài viết và có th copy trc tiếp vào bài viết
2. Cài đặt SPSS 12.0 cho máy tính
- Double click vào biu tượng Setup.exe trong thư mc SPSS 12.0 để cài đặt.
- Nhn Next đến khi ca s dưới đây xut hin
2
II/ MT S KIU THIT K THÍ NGHIM NG DNG SPSS ĐỂ S S LIU
2.1. Thiết kế thí nghim theo kiu ngu nhiên hoàn toàn (CRD Completely
Randomised Design)
Thiết kế thí nghim theo kiu ngu nhiên hoàn toàn nghĩa là các nghim thc được phân vào các
đơn v t nghim mt ch hoàn toàn ngu nhiên, hay mi đơn v t nghim mt cơ hi ging
nhau để được tiếp nhn mt nghim thc.
Thiết kế thí nghim theo kiu này rt hiu qu trong trường hp các đơn v thí nghim đồng đều
nhau ngược li s không hiu qu nếu các đơn v t nghim không đồng nht. Bao gm thiết kế
thí nghim ngu nhiên hoàn toàn mt nhân t thiết kế thí nghim ngu nhiên hoàn toàn đa nhân
t. Các nhân t trong thí nghim th ch nhân t định tính hoc định lượng hoc bao gm c
hai. Trong các nhân t thí nghim li th có nhiu mc nhân t. Thí nghim mt nhân t cung cp
thông tinh v nh hưởng chính ch ca mt nhân t thí nghim. T nghim đa nhân t Có hai hoc
nhiu hơn nhân t được nghiên cu đồng thi. Có hiu qu hơn so vi tiến hành tng thí nghim
riêng l và cung cp thông tin v nh hưởng chính nh hưởng ca tương tác gia các nhân t.
- M fine Licence 12.0SPSS để copy dòng s
55345 26752 51345 33006 86803 93573 71895 65752 87
sau đó pasteo ô Licence code.
- Click Update để tiếp tc cài ct.
- Nhn Next/Next/Install quá trình cài đặt mt vài phút, nhn Finish để hoàn tt cài đặt.
Note:
+ Nếu quá trình cài đặt báo li thì có th phi g b các chương trình Anti virut thường không tương thích
vi SPSS 12.0 (AVG, Noton….), sau khi cài đặt SPSS hoàn tt có th cài đặt li các chương trình Anti
virut này.
+ o Start/ Program để đưa biu tượng ca SPSS 12.0 SPSS 12.0 for Windows.lnk ra màn hình, để tin li
cho vic s dng.
3
* Mô hình ANOVA mt nhân t
yij=μ+Ai+eij
yij: Giá tr ca biến ph thuc ca con vt j trong nghim thc i (i=1,…a; j=1,n)
i ch s mc ca nhân t, j ch s ln lp li
μ: Là trung bình tng th
Ai: Là nh hưởng c định hoc ngu nhiên ca nhân t nghiên cu vi mc i
eij: Là hiu dư, IID N(0,σ2), independent identically distributed
1. Tình hung 1: Nghiên cu nh hưởng ca 3 mc protein 14%; 17%; 18% trong khu phn đến
tăng trng ca ln lai F1 (MC x ĐM) trong giai đon sinh trưởng. Có 24 ô chung và 24 con ln.
Các con ln này tương đồng v các yếu t tui tác, trng lượng…
a. Phân tích tình hung
- Nhân t thí nghim: 1 nhân t, là mc protein.
- Mc nn t: 3 mc (14% pro, 17% pro, 18% pro)
- Kiu thiết kế thí nghim: ngu nhiên hoàn toàn.
- Đơn v thí nghim: mi cá th ln.
- S ln lp li: 24/3 = 8 ln.
b.Thiết kế thí nghim (bng Excel)
- B1: Lit kê danh sách các ô chung tương ng cho tng cá th ln thí nghim (ochuong)
B2: Dùng m RAND() trong EXCEL để gán các con s ngu nhiên cho các ô chung (Rand1)
sau đó copy past special các con s này ti đúng v trí y.
B3: Dùng m SORT trong th DATA, có thng ascending hay descending, SORT theo s
ngu nhiên va mi to (Rand1), chú ý bao gm c s ô chung (ochuong)
B4: Lit kê các mc protein theo th t 18%, 17%, 14%; 18%, 17%, 14%;..ho c ngược li. Đồng
thi to s ngu nhiên th 2 (Rand 2).
B5: SORT ln th 2 theo ct vùng cha 2 ct mc protein (muc protein) và s ngu nhiên 2
(Rand 2).
B6: SORT theo ct vùng cha 2 ct ochuong muc protein.
B¶ng 1
.
Bng tãm t¾t AN
OVA trong t nghim kiu CRD vi 1 nn t
Nguån bn ®éng df MS F
Gi÷a c nhãm/
nhân
t thí nghim
a-1 MS
T
MS
T
/MS
E
Trong c¸c nhãm a(n-1) MS
E
Tæng an-1
4
Hình1: Thiết kế thí nghim ngu nhiên hoàn toàn mt nhân t bng Excel
Kết qu thiết kế:
Các mc protein được phân chia hoàn toàn ngu nhiên vào các cá th ln như sau:
Mc protein 14% được phân chia vào các ô chung: 3; 7; 11; 19; 20; 22; 23; 24.
Mc protein 17% được phân chia vào các ô chung: 5; 6; 13; 15; 16; 17; 18; 21.
Mc protein 18% được phân chia vào các ô chung còn li: 1; 2; 4; 8; 9; 10; 12; 14.
Chú ý: Vch thiết kế thí nghim trên:
ch làm như trên gi là Double randomization tuy nhiên, theo tài liu Design of Experiments:
Statistical Principles of Research Design and Analysis (Kuehl, 2000), thì bước th 4 có th trc
tiếp pn các mc protein vào các ô chung, 18, 18…18; 17, 17…17; 14, 14…14. Cách làm như
vy còn gi là Single randomization
c. Nhp kết qu và x lý bng SPSS
* Nhp s liu:
Gi s kết qu tăng trng (kg/tháng) trong thí nghim thu được như sau:
5
Như vy, s liu thí nghim s được nhp theo ct tương ng vi tng mc protein trong Excel. Sau
đó file này được s dng để chy bng SPSS.
* X lý bng SPSS
- Phân tích thng kê
Chn th Analyze/ Descriptive Statistics, sau đó tùy theo tng thí nghim mc đích phân tích
thng để chn các th kc nhau. Frequencies cho phân tích theo tn s, tn sut; Descriptives
cho phân tích mô t; Exprore cho phân tích mô t chi tiết; Ratio cho phân tích theo t l, t s.
Trong tình hung này, phép phân ch t chi tiết cho biết thông tin đầy đủ nht. Chn Analyze/
Descriptive Statistic/ Exprore hp thoi Exprore xut hin như sau:
Mc protein (%)
th
14%
17%
18%
1
11
15
13
2
3
14
14
3
6
10
6
4
10
12
10
5
7
12
12
6
8
6
12
7
9
9
16
8
2
10
13