Ứng dụng phần mềm SPSS 12.0 trong xử lý thống kê
lượt xem 36
download
SPSS là tên viết tắt của cụm từ Statistical Package for the Social Sciences. Đây là một phần mềm được sử dụng rộng dãi nhất để phân tích thống kê trong nghiên cứu khoa học tự nhiên và khoa học xã hội nói chung. Phiên bản đầu tiên được phát hành năm 1968 do Công ty liên hợp SPSS- Chicago Mỹ sản xuất. Đến tháng 7 năm 2007 đã có phiên bản thứ 16 (SPSS 16.0) Môi trường làm việc của SPSS gồm hai phần: phần soạn thảo dữ liệu đầu vào (SPSS Data Editor) và phần kết quả đầu ra (Output – SPSS Viewer)....
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Ứng dụng phần mềm SPSS 12.0 trong xử lý thống kê
- Ứng dụng phần mềm SPSS 12.0 trong xử lý thống kê I/ GIỚI THIỆU CHUNG 1. Sơ lược về phần mềm SPSS SPSS là tên viết tắt của cụm từ Statistical Package for the Social Sciences. Đây là một phần mềm được sử dụng rộng dãi nhất để phân tích thống kê trong nghiên cứu khoa học tự nhiên và khoa học xã hội nói chung. Phiên bản đầu tiên được phát hành năm 1968 do Công ty liên hợp SPSS- Chicago Mỹ sản xuất. Đến tháng 7 năm 2007 đã có phiên bản thứ 16 (SPSS 16.0) Môi trường làm việc của SPSS gồm hai phần: phần soạn thảo dữ liệu đầu vào (SPSS Data Editor) và phần kết quả đầu ra (Output – SPSS Viewer). SPSS Data Editor gồm Data Viewer và V ariable Vierer cho phép nhập số liệu đầu vào trực tiếp hoặc add file số liệu ở dạng Excel.xml, đồng thời định dạng các biến số theo dạng số (number) hay dạng trữ (String). Output – SPSS Viewer chứa các kết quả mong muốn sau khi chạy các phép toán tương ứng. Tương tự như các phần mềm Genstar và Minitab, SPSS 12.0 cho phép sử lý các phép phân tích thống kê thông thường như: Descriptive statistics: Cross tabulation (sắp xếp thành bảng, hàng đối xứng nhau); Frequencies (tần số, tần suất….); Descriptive (mô tả, diễn tả…); Explore (khảo sát tỉ mỉ…); Descriptive Ratio Statistics (thống kê mô tả tỷ lệ, tỷ số….). Bivariate statistics (thống kê hai biến số): Means (trung bình); t-test (phép thử, kiểm tra, phân tích…); ANOVA (phân tích phương sai); Correlation (tương quan) bao gồm bivariate (hai biến), partial (tương quan từng phần, tương quan không hoàn toàn), distances (tương quan dời dạc, lỏng lẻo); Nonparametric tests (kiểm tra thông số giới hạn). Prediction for numerical outcomes: Linear regression (dự đoán về kết quả bằng số dạng hồi qui tuyến tính…) Prediction for identifying groups: Factor analysis (phân tích nhân tố); cluster analysis (phân tích cho đám đông) bao gồm two – step (hai bậc), K-means (số K), hierarchic (có thứ bậc). SPSS cũng cho phép lưu và chạy lại các thuật toán giúp việc kiểm tra kết quả dễ dàng. Nhưng phần Output – SPSS Viewer đã được thiết kế tiện lợi hơn cho người sử dụng. Mục này bao gồm các bảng kết quả (ví dụ như bảng phân tích phương sai, bảng thống kê mô tả….) hay các đồ thị có thể được thay đổi định dạng trực tiếp cho phù hợp với form của bài viết và có thể copy trực tiếp vào bài viết 2. Cài đặt SPSS 12.0 cho máy tính Setup.exe - Double click vào biểu tượng trong thư mục SPSS 12.0 để cài đặt. - Nhấn Next đến khi cửa sổ dưới đây xuất hiện 1
- - Mở fine Licence 12.0SPSS để copy dòng số 55345 26752 51345 33006 86803 93573 71895 65752 87 sau đó paste vào ô Licence code. - Click Update để tiếp tục cài cặt. - Nhấn Next/Next/Install quá trình cài đặt mất vài phút, nhấn Finish để hoàn tất cài đặt. Note: + Nếu quá trình cài đặt báo lỗi thì có thể phải gỡ bỏ các chương trình Anti virut thường không tương thích với SPSS 12.0 (A VG, Noton….), sau khi cài đặt SPSS hoàn tất có thể cài đặt lại các chương trình Anti virut này. SPSS 12.0 for Windows.lnk + Vào Start/ Program để đưa biểu tượng của SPSS 12.0 ra màn hình, để tiện lợi cho việc sử dụng. II/ MỘT SỐ KIỂU THIẾT KẾ THÍ NGHIỆM VÀ ỨNG DỤNG SPSS ĐỂ SỬ LÝ SỐ LIỆU 2.1. Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn (CRD – Completely Randomised Design) Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn có nghĩa là các nghiệm thức được phân vào các đơn vị thí nghiệm một cách hoàn toàn ngẫu nhiên, hay mỗi đơn vị thí nghiệm có một cơ hội giống nhau để được tiếp nhận một nghiệm thức. Thiết kế thí nghiệm theo kiểu này rất hiệu quả trong trường hợp các đơn vị thí nghiệm đồng đều nhau và ngược lại sẽ không hiệu quả nếu các đơn vị thí nghiệm không đồng nhất. Bao gồm thiết kế thí nghiệm ngẫu nhiên hoàn toàn một nhân tố và thiết kế thí nghiệm ngẫu nhiên hoàn toàn đa nhân tố. Các nhân tố trong thí nghiệm có thể chỉ có nhân tố định tính hoặc định lượng hoặc bao gồm cả hai. Trong các nhân tố thí nghiệm lại có thể có nhiều mức nhân tố. Thí nghiệm một nhân tố cung cấp thông tinh về ảnh hưởng chính chỉ của một nhân tố thí nghiệm. Thí nghiệm đa nhân tố Có hai hoặc nhiều hơn nhân tố được nghiên cứu đồng thời. Có hiệu quả hơn so với tiến hành từng thí nghiệm riêng lẻ và cung cấp thông tin về ảnh hưởng chính và ảnh hưởng của tương tác giữa các nhân tố. 2
- * Mô hình ANOVA một nhân tố yij=μ+Ai+eij – yij: Giá trị của biến phụ thuộc của con vật j trong nghiệm thức i (i=1,…a; j=1,…n) – i chỉ số mức của nhân tố, j chỉ số lần lặp lại – μ: Là trung bình tổng thể – Ai: Là ảnh hưởng cố định hoặc ngẫu nhiên của nhân tố nghiên cứu với mức i – eij: Là hiệu dư, IID N(0,σ2), independent identically distributed B¶ng 1 . B¶ng tãm t¾t AN OVA trong thí nghiệm kiểu CRD với 1 nhân tố Nguån biÕn ®éng df MS F Gi÷a c¸c nhãm/ nhân a-1 MST MST/MS E tố thí nghiệm Trong c¸c nhãm a(n-1) MSE Tæng an-1 1. Tình huống 1: Nghiên cứu ảnh hưởng của 3 mức protein 14%; 17%; 18% trong khẩu phần đến tăng trọng của lợn lai F1 (MC x ĐM) trong giai đoạn sinh trưởng. Có 24 ô chuồng và 24 con lợn. Các con lợn này tương đồng về các yếu tố tuổi tác, trọng lượng… a. Phân tích tình huống - Nhân tố thí nghiệm: 1 nhân tố, là mức protein. - Mức nhân tố: 3 mức (14% pro, 17% pro, 18% pro) - Kiểu thiết kế thí nghiệm: ngẫu nhiên hoàn toàn. - Đơn vị thí nghiệm: mỗi cá thể lợn. - Số lần lặp lại: 24/3 = 8 lần. b.Thiết kế thí nghiệm (bằng Excel) - B1: Liệt kê danh sách các ô chuồng tương ứng cho từng cá thể lợn thí nghiệm (ochuong) – B2: Dùng hàm RAND() trong EXCEL để gán các con số ngẫu nhiên cho các ô chuồng (Rand1) sau đó copy và past special các con số này tại đúng vị trí ấy. – B3: Dùng hàm SORT trong thẻ DA TA, có thể dùng ascending hay descending, SORT theo số ngẫu nhiên vừa mới tạo (Rand1), chú ý bao gồm cả số ô chuồng (ochuong) – B4: Liệt kê các mức protein theo thứ tự 18%, 17%, 14%; 18%, 17%, 14%;..ho ặc ngược lại. Đồng thời tạo số ngẫu nhiên thứ 2 (Rand 2). – B5: SORT lần thứ 2 theo cột vùng chứa 2 cột mức protein (muc protein) và số ngẫu nhiên 2 (Rand 2). – B6: SORT theo cột vùng chứa 2 cột ochuong và muc protein. 3
- Hình1: Thiết kế thí nghiệm ngẫu nhiên hoàn toàn một nhân tố bằng Excel Kết quả thiết kế: Các mức protein được phân chia hoàn toàn ngẫu nhiên vào các cá thể lợn như sau: – Mức protein 14% được phân chia vào các ô chuồng: 3; 7; 11; 19; 20; 22; 23; 24. – Mức protein 17% được phân chia vào các ô chuồng: 5; 6; 13; 15; 16; 17; 18; 21. – Mức protein 18% được phân chia vào các ô chuồng còn lại: 1; 2; 4; 8; 9; 10; 12; 14. Chú ý: Về cách thiết kế thí nghiệm trên: Cách làm như trên gọi là Double randomization tuy nhiên, theo tài liệu Design of Experiments: Statistical Principles of Research Design and Analysis (Kuehl, 2000), thì ở bước thứ 4 có thể trực tiếp phân các mức protein vào các ô chuồng, 18, 18…18; 17, 17…17; 14, 14…14. Cách làm như vậy còn gọi là Single randomization c. Nhập kết quả và xử lý bằng SPSS * Nhập số liệu: Giả sử kết quả tăng trọng (kg/tháng) trong thí nghiệm thu được như sau: 4
- Mức protein (%) Cá thể 14% 17% 18% 1 11 15 13 2 3 14 14 3 6 10 6 4 10 12 10 5 7 12 12 6 8 6 12 7 9 9 16 8 2 10 13 Như vậy, số liệu thí nghiệm sẽ được nhập theo cột tương ứng với từng mức protein trong Excel. Sau đó file này được sử dụng để chạy bằng SPSS. * Xử lý bằng SPSS - Phân tích thống kê Chọn thẻ Analyze/ Descriptive Statistics, sau đó tùy theo từng thí nghiệm và mục đích phân tích thống kê để chọn các thẻ khác nhau. Frequencies cho phân tích theo tần số, tấn suất; Descriptives cho phân tích mô tả; Exprore cho phân tích mô tả chi tiết; Ratio cho phân tích theo tỷ lệ, tỷ số. Trong tình huống này, phép phân tích mô tả chi tiết cho biết thông tin đầy đủ nhất. Chọn Analyze/ Descriptive Statistic/ Exprore hộp thoại Exprore xuất hiện như sau: 5
- Chọn tangtrong là biến phụ thuộc (đưa vào ô Dependent list), mucprotein là nhân tố thí nghiệm (đưa vào ô Factor list). Trong phần Display chọn Statistics nếu chỉ mong muốn có kết quả thống kê; Plots nếu chỉ mong muốn có sơ đồ, đồ thị hay biểu đồ; Both nểu mong muốn có cả 2 kết quả trên. Vào từng hộp thoại Statistics; Plots và Options để chọn các thông số, khoảng tin cậy cho giá trị trung bình (Confidence Interval for mean) hay các dạng đồ thị, biểu đồ mong muốn. Chọn Discriptives/ Histogram cho dạng biểu đồ, Boxplots /Factor level together cho trường hợp biểu đồ biểu diễn các mức nhân tố với nhau, dạng biểu đồ khối hộp; Boxplots/ Dependent together cho trường hợp biểu đồ giữa các biến phụ thuộc với nhau, dạng biểu đồ khối hộp). Kết quả sau đây xuất hiện trong hộp Output -SPSS Viewer: Explore mucprotein Case Processing Summary Cases Valid Missing T otal mucprotein N Percent N Percent N Percent tangtrong 14 8 100.0% 0 .0% 8 100.0% 17 8 100.0% 0 .0% 8 100.0% 18 8 100.0% 0 .0% 8 100.0% 6
- Descriptives mucprotein Statistic Std. Error tangtrong 14 Mean 7.00 1.134 95% Confidence Lower Bound 4.32 Interval for Mean Upper Bound 9.68 5% Trimmed Mean 7.06 Median 7.50 Variance 10.286 Std. Deviation 3.207 Minimum 2 Maximum 11 Range 9 Interquartile Range 6 Skewness -.520 .752 Kurtosis -.894 1.481 17 Mean 11.00 1.018 95% Confidence Lower Bound 8.59 Interval for Mean Upper Bound 13.41 5% Trimmed Mean 11.06 Median 11.00 Variance 8.286 Std. Deviation 2.878 Minimum 6 Maximum 15 Range 9 Interquartile Range 4 Skewness -.335 .752 Kurtosis .004 1.481 18 Mean 12.00 1.052 95% Confidence Lower Bound 9.51 Interval for Mean Upper Bound 14.49 5% Trimmed Mean 12.11 Median 12.50 Variance 8.857 Std. Deviation 2.976 Minimum 6 Maximum 16 Range 10 Interquartile Range 3 Skewness -1.084 .752 Kurtosis 2.032 1.481 7
- 16 14 12 tangtrong 10 8 19 6 4 2 14 17 18 mucprotein Qua bảng Descriptives có thể rút ra một số kết quả cần thiết sau: Bảng 1: Thống kê mô tả ảnh hưởng của các mức protein khác nhau đến tăng trọng của lợn Nhóm Tbình Phương sai 14% 7 10,286 17% 11 8,286 18% 12 8,857 Qua biểu đồ trên, cho thấy các giá trị tăng trọng của lợn trong mỗi mức protein có phân bố chuẩn. Các mức protein khác nhau có ảnh hưởng đến tăng trọng lợn khác nhau. Mức 18% protein cho tăng trọng cao nhất trong các mức. Đồng thời qua biểu đồ cũng cho biết các giá trị ngoại lai, khác thường. Ví dụ ở mức 18% có giá trị tăng trọng 19kg/tháng là bất thường. Do vậy có thể kiểm tra lại số liệu trong trường hợp cần thiết, kiểm tra từ Data viewer . Tuy nhiên, các kết quả thống kế trên chỉ mới cho biết rất ít các thông số. Chưa chỉ ra sự sai khác về ảnh hưởng của các mức protein khác nhau đến tăng trọng lợn. Do đó cần tiến hành kiểm tra phương sai (ANOV A) và h ANOV A ( iểm tra post-hoc) để biết ảnh hưởng khác nhau của các nhóm như ậu k thế nào. SPSS cho phép kiểm tra tất cả các yêu cầu trên bằng một phép toán. ần Trước khi phân tích ANOV A, c kiểm tra xem các số liệu có theo phân bố chuẩn hay không. Phép toán Homogeneity tests cho phép kiểm tra xem có sự đồng nhất phương sai hay không, cũng có nghĩa là số liệu có phân bố chuẩn hay không. Homogeneity tests kiểm tra với giả thiết Ho: có sự đồng nhất phương sai của số liệu; đối thiết H1: không có sự đồng nhất phương sai của các số liệu. Phép kiểm tra đồng nhất phương sai trong SPSS tiến hành như sau: 8
- Click vào thẻ Homogeneity test ở mục Options trong hộp thoại Univariate hoặc Homogeneity of V ariance test ở mục Options trong hộp thoại One- W ay ANOVA. Kết quả kiểm tra đồng nhất phương sai thể hiện ở dạng bảng sau: Levene's Test of Equality of Error Variances(a) Dependent Variable: tangtrong F df1 df2 Sig. .151 2 21 .861 T ests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+mucprotein 6 5 4 Frequency Đồ thị kiểm tra mức độ 3 tập trung, theo phân bố chuẩn của số liệu 2 1 Mean = 10 Std. Dev . = 3.636 N = 24 0 2 4 6 8 10 12 14 16 tangtrong Trong đó df1 là số bậc tự do của mức nhân tố; df2 là số bậc tự do của mẫu. Sig = p là mức ý nghĩa, nếu Sig > 0,05 thì chấp nhận giả thiết Ho, có nghĩa có sự đồng nhất về phương sai của số liệu, ngược lại Sig < 0,05 thì bác bỏ Ho, chấp nhận H1, khi đó các phép phân tích phương sai là không có ý nghĩa. Khi Sig > 0,05 thì tiến hành phân tích phương sai. Phép phân tích phương sai trong SPSS tiến hành như sau: Mean : cho phép so sánh các giá trị trung bình. Chọn Analyze /Compare Means One-sample T Test: cho phép kiểm tra mẫu đơn. Paired-samples T Test: cho phép kiểm tra cặp đôi. One – way ANOVA: cho phép kiểm tra 1 chiều (1 yếu tố). Univariate: cho trường hợp có một biến phụ thuộc (bao gồm 1 hoặc nhiều mức nhân tố) Hoặc chọn Analyze /General linear model Multivariate: cho trường hợp có từ hai biến phụ thuộc trở lên (bao gồm một hoặc nhiều mức nhân tố) Tuy nhiên, trong SPSS kiểm tra phân bố chuẩn và phân tích ANOV A th ường không tiến hành đơn lẻ. Có nghĩa là, trong cùng một hộp thoại cho phép lựa chọn đồng thời hai nội dung này. Khi máy tính xử lý sẽ tự động kiểm tra phân bố chuẩn trước, sau đó phân tích phương sai. Trong tình huống này, tiến hành xử lý trong SPSS như sau: 9
- Analyze /Compare Means / One – Way ANOVA Chọn tangtrong là biến phụ thuộc (ô Dependent list); mucprotein là nhân tố cố định (ô Factor). Trong hộp thoại One- Way ANOVA: Ở mục contrasts chọn polynomial (trong trường hợp khoảng cách giữa các mức nhân tố không đều 14% - 17% và 17% - 18%) đồng thời chọn linear (cho dạng phương trình bậc nhất); Quadratic (cho dạng phương trình bậc hai); Cubic (cho dạng phương trình bậc ba); 4th; 5th …cho dạng phương trình bậc 4, bậc 5…không chọn polynomial cho trường hợp khoảng cách các mức nhân tố bằng nhau. Ở mục Post Hoc chọn các dạng so sánh Tukey (cho trường hợp số mẫu trong các nhóm bằng nhau); LSD (cho trường hợp số mẫu trong các nhóm có thể không bằng nhau), Duncan….chọn mức ý 0,05 hoặc 0,01…Trong tình huống này chọn so sánh LSD và Tukey (để so sánh độ nhạy cảm của hai phương pháp này), mức ý nghĩa p = 0,05. Ở mục Option chọn Discriptis và Homogeneity of V ariance test Kết quả sau đây trong Output – SPSS Viewer: Oneway Descriptives tangtrong Std. 95% Confidence Interval for N Mean Deviation Std. Error Mean Minimum Maximum Mucprotein Lower Upper Bound Bound 14 8 7.00 3.207 1.134 4.32 9.68 2 11 17 8 11.00 2.878 1.018 8.59 13.41 6 15 18 8 12.00 2.976 1.052 9.51 14.49 6 16 T otal 24 10.00 3.636 .742 8.46 11.54 2 16 Test of Homogeneity of Variances tangtrong Levene Statistic df1 df2 Sig. .151 2 21 .861 ANOVA tangtrong Sum of Squares df Mean Square F Sig. Between (Combined) 112.000 2 56.000 6.125 .008 Groups Linear T erm Contrast 111.692 1 111.692 12.216 .002 Deviation .308 1 .308 .034 .856 Within Groups 192.000 21 9.143 T otal 304.000 23 10
- Post Hoc Tests Multiple Comparisons Dependent Variable: tangtrong Mean 95% Confidence Interval (I) (J) Difference Std. Error Sig. mucprotein mucprotein Lower Upper (I-J) Bound Bound Tukey HSD 14 17 -4.000(*) 1.512 .039 -7.81 -.19 18 -5.000(*) 1.512 .009 -8.81 -1.19 17 14 4.000(*) 1.512 .039 .19 7.81 18 -1.000 1.512 .788 -4.81 2.81 18 14 5.000(*) 1.512 .009 1.19 8.81 17 1.000 1.512 .788 -2.81 4.81 LSD 14 17 -4.000(*) 1.512 .015 -7.14 -.86 18 -5.000(*) 1.512 .003 -8.14 -1.86 17 14 4.000(*) 1.512 .015 .86 7.14 18 -1.000 1.512 .516 -4.14 2.14 18 14 5.000(*) 1.512 .003 1.86 8.14 17 1.000 1.512 .516 -2.14 4.14 * The mean difference is significant at the .05 level. Homogeneous Subsets tangtrong Subset for alpha = .05 mucprotein N 1 2 Tukey 14 8 7.00 HSD(a) 17 8 11.00 18 8 12.00 Sig. 1.000 .788 Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = 8.000. * Lưu câu lệnh cho các phép toán trong SPSS: Click vào paste trong hộp thoại Univariate, 1 hộp thoại xuất hiện có tên Syntax – SPSS Syntax Editor . Chọn File /Save (Save as) trên thanh công cụ để lưu câu lệnh, lần sau có thể mở file chứa câu lệnh và chạy Run. * Tạo biểu đồ, đồ thị trong SPSS Chọn Graphs, sau đó chọn dạng biểu đồ mong muốn (thao tác vẽ biểu đồ trong SPSS giống như trong Minitab). 11
- 16 Histogram 14 6 12 5 tangtrong 10 4 Frequency 8 3 19 6 2 4 1 2 Mean = 10 Std. Dev. = 3.636 0 14 17 18 N = 24 2 4 6 8 10 12 14 16 mucprotein tangtrong Biểu đồ dạng Boxplots Đồ thị kiểm tra mức độ tập trung, theo phân bố chuẩn của số liệu * Mô hình ANOVA hai nhân tố yijk=μ+Ai+Bj + ABij +eijk – yijk: Giá trị của biến phụ thuộc của con vật k trong nghiệm thức A mức i và nhân tố B mức j (i=1,…a; j=1,…b; k=1,…n) – μ: Là trung bình tổng thể – Ai: Là ảnh hưởng cố định hoặc ngẫu nhiên của nhân tố A với mức i – Bj: Là ảnh hưởng cố định hoặc ngẫu nhiên của B nghiên cứu với mức j – ABij: Là ảnh hưởng cố định hoặc ngẫu nhiên của tương tác giữa i và j – eijk: Là hiệu dư, IID N(0,σ2) – k chỉ số lần lặp B¶ng 2. Tãm t¾t ANOVA hai nh©n tè Nguån biÕn ®éng df MS F Nh©n tè A a-1 MSA MSA/MSW Nh©n tè B b-1 MSB MSB/MSW AXB (a-1)(b-1) MSAB MSAB/MSW NgÈu nhiªn (trong NT-ab MSW c¸c nhãm) Tæng NT-1 Tình huống 2: Nghiên cứu hàm lượng canxi trong máu của gà thuộc 2 giới tính khác nhau do ảnh hưởng của việc có hay không có xử lý hormone – 20 con gà (10 trống, 10 mái) tương đồng nhau về các yếu tố tuổi tác, trọng lượng… – Cơ sở nghiên cứu có đủ điều kiện để nuôi cá thể 12
- a. Phân tích tình huống: – Nhân tố thí nghiệm: 2 nhân tố • Giới tính: Trống và Mái • Hormone: Có xử lý hormone, không xử lý hormone. – Kiểu thiết kế thí nghiệm: Ngẫu nhiên hoàn toàn – Đơn vị thí nghiệm: Mỗi cá thể gà – Số lần lặp lại: 5 b. Thiết kế thí nghiệm ( sử dụng Excel 4.0) c. Nhập số liệu và phân tích thống kê bằng SPSS Nhập số liệu trực tiếp trên SPSS hoặc trên Excel rồi mở bằng SPSS. 13
- Kiểm tra đồng nhất phương sai, phân tích phương sai, các thống kê mô tả, tất cả được thực hiện bằng phép toán Analyze/ General Linear Model/ Univariate (cho trường hợp có 1 biến phụ thuộc, như trong tình huống 1) Univariate Analysis of Variance Between-Subjects Factors N gioitinh M 10 T 10 Hormon C 10 K 10 Descriptive Statistics 14
- Dependent Variable: Canxi mau gioitinh Hormon Mean Std. Deviation N M C 25.620 4.1288 5 K 12.920 1.3809 5 T otal 19.270 7.2957 10 T C 27.020 2.0327 5 K 14.080 3.5647 5 T otal 20.550 7.3482 10 T otal C 26.320 3.1555 10 K 13.500 2.6209 10 T otal 19.910 7.1569 20 Levene's Test of Equality of Error Variances(a) Dependent Variable: Canxi mau F df1 df2 Sig. 1.717 3 16 .204 T ests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Hormon+gioitinh+gioitinh * Hormon Tests of Between-Subjects Effects Dependent Variable: Canxi mau Type III Sum Source of Squares df Mean Square F Sig. Corrected Model 830.026(a) 3 276.675 30.919 .000 Intercept 7928.162 1 7928.162 886.001 .000 Hormon 821.762 1 821.762 91.835 .000 gioitinh 8.192 1 8.192 .915 .353 gioitinh * Hormon .072 1 .072 .008 .930 Error 143.172 16 8.948 T otal 8901.360 20 Corrected T otal 973.198 19 a R Squared = .853 (Adjusted R Squared = .825) Kết quả trên cho thấy, trong bảng Levene's Test of Equality of Error Variances(a),Sig = 0,204 >0,05 có nghĩa có sự đồng nhất về phương sai (Giả thuyết Ho: Có sự đồng nhất phương sai; Đối thiết H1: Không có sự đồng nhất phương sai). Cũng có thể kiểm tra sự phân bố chuẩn của số liệu bằng phép toán Graphs/ Histogram ( Chọn Display normal curve để có đường cong phân bố chuẩn). 15
- 5 4 Frequency 3 2 1 M e an = 19 .91 S td. De v . = 7 .15 69 N = 20 0 1 0.0 1 5.0 20.0 25.0 30 .0 Canxi mau - Sự bổ sung Hormon có ảnh hưởng đến hàm lượng canxi trong máu (p = 0.000< 0.05) sự sai khác có ý nghĩa thống kê. - Giới tính không có ảnh hưởng đến hàm lượng canxi trong máu (p =0.353 > 0.05) sự sai khác không có ý nghĩa thống kê). - Không có ảnh hưởng tương tác giữa hormone và giới tính (p = 0.930 > 0.05). (Các bảng kết quả, đồ thị trong SPSS có th ể copy nguyên dạng và page vào Word dễ dàng). * Trình bày kết quả trong báo cáo Bảng 1. Ảnh hưởng của hormone đến hàm lượng canxi trong máu của gà (mg/100ml) Hormon Trống Mái Trung bình Có 27,020a 25,620a 26,320a Không có 14,080b 12,920b 13,50b Trung bình 20,550 19,270 a, b chỉ sự sai khác có ý nghĩa ở mức p= 0.05 2.2. Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn theo khối (RCB - Randomized Completed Block Design). Thế nào là thiết kế theo khối ngẫu nhiên hoàn toàn? Thiết kế theo khối ngẫu nhiên hoàn toàn là thiết kế thí nghiệm có các đặc tính sau: – Theo khối: Các nhóm của thiết kế ngẫu nhiên hoàn toàn – Ngẫu nhiên: Áp dụng ngẫu nhiên trong mỗi khối – Hoàn toàn:Tất cả nghiệm thức được phân vào trong mỗi khối * Ưu điểm của thiết kế ngẫu nhiên hoàn toàn theo khối 16
- RCB hiệu quả hơn CRD • Các đơn vị thí nghiệm trong các nhóm là tương đồng với nhau hơn • Các đơn vị thí nghiệm giữa các nhóm là khác nhau hơn • Sai số thí nghiệm là nhỏ hơn * M« h×nh cña thiÕt kÕ thÝ nghiÖm theo khèi ngÉu nhiªn hoàn toàn Mô hình tuyến tính không tương tác: yij = µ+ Bi + Dj + εij • yij : Träng lîng ban ®Çu • Bi : ¶nh hö¬ng cña khèi • Dj: ¶nh hö¬ng cña nh©n tè thÝ nghiÖm • εij: hiÖu d • µ: Trung b×nh tæng thÓ. Mô hình tuyến tính có tương tác: yijk = µ + Bi + Dj + BDij + εijk yijk = quan sát trên cá thể k cho nhân tố i, j. BDij: là ảnh hưởng của tương tác giữa 2 nhân tố i, j. Tình huống: - Ảnh hưởng của các khẩu phần đến tăng trọng của lợn - 4 khẩu phần - 6 con/khẩu phần - Nuôi cá thể Các đơn vị thí nghiệm được phân chia một cách ngẫu nhiên vào các khẩu phần. a. Phân tích tình huống: Để đánh giá được ảnh hưởng của các khẩu phần đến tăng trọng lợn thì cần phải loại bỏ hoặc tính toán được các ảnh hưởng khác không phải từ khẩu phần để hiệu chỉnh sai số do các ảnh hưởng này mang lại. Vì vậy các lợn thí nghiệm cần được phân chia một cách ngẫu nhiên vào 4 khẩu phần, làm thế nào đó để trọng lượng ban đầu là giống nhau cho mỗi khẩu phần (khối lượng lợn thí nghiệm trong mỗi khẩu phần tương đối đồng nhất). Thiết kế thí nghiệm kiểu khối ngẫu nhiên hoàn toàn. - Nhân tố thí nghiệm: khẩu phần ăn - Mức nhân tố: 4 mức - Đơn vị thí nghiệm: mỗi các thể lợn - Số lần lặp lại = số khối = 6. b. Cách thiết kế thí nghiệm 17
- c. Nhập số liệu và xử lý thống kê * Nhập số liệu (tiến hành trong Excel) 18
- * Xử lý thống kê trong SPSS Xử dụng phép phân tích Analyze/ General Linear Model/ Univariate Chọn tangtrong cho Dependent V ariable khauphan cho Fixed Factor , khoi cho random factor . Trong hộp thoại Model chọn Custom, chọn các mô hình khauphan; khoi; khauphan*khoi để xem ảnh hưởng cộng gộp của khối và phẩu phần. Nhấn continue để tiếp tục. Trong hộp thoại Post hoc Mutiple Comparions chọn khauphan cho ô Post Hoc test for . Chọn so sánh LSD hoặc Tukey tùy theo mục đích so sánh và yêu cầu của thí nghiệm, sau đó nhấn continue để tiếp tục. Trong hộp thoại Option chọn khauphan cho Display means for , chọn Descriptive Statistics cho các mô tả thống kê và Homogeneity tests cho phép kiểm tra đồng nhất phương sai. Kết quả sau đây xuất hiện trong hộp thoại Output – SPSS Viewer: Univariate Analysis of Variance Warnings Post hoc tests are not performed for Khauphan because error term has zero degrees of freedom. Levene's Test of Equality of Error Variances(a) Dependent Variable: tangtrong F df1 df2 Sig. . 23 0 . T ests the null hypothesis that the error variance of the dependent variable is equal across groups. a Design: Intercept+Khauphan+khoi+Khauphan * khoi 19
- Tests of Between-Subjects Effects Dependent Variable: tangtrong Type III Sum Source of Squares df Mean Square F Sig. Intercept Hypothesis 8580104.167 1 8580104.167 803.067 .000 Error 53420.833 5 10684.167(a) Khauphan Hypothesis 114712.500 3 38237.500 18.001 .000 Error 31862.500 15 2124.167(b) khoi Hypothesis 53420.833 5 10684.167 5.030 .007 Error 31862.500 15 2124.167(b) Khauphan * Hypothesis 31862.500 15 2124.167 . . khoi Error .000 0 .(c) a MS(khoi) b MS(Khauphan * khoi) c MS(Error) Expected Mean Squares(a,b) Variance Component Var(Khauph Quadratic Source Var(khoi) an * khoi) Var(Error) T erm Intercept Intercept, 4.000 1.000 1.000 Khauphan Khauphan .000 1.000 1.000 Khauphan khoi 4.000 1.000 1.000 Khauphan * khoi .000 1.000 1.000 Error .000 .000 1.000 a For each source, the expected mean square equals the sum of the coefficients in the cells times the variance components, plus a quadratic term involving effects in the Quadratic T erm cell. b Expected Mean Squares are based on the Type III Sums of Squares. Khauphan Dependent Variable: tangtrong 95% Confidence Interval Khauphan Mean Std. Error Lower Bound Upper Bound A 606.667 . . . B 496.667 . . . C 596.667 . . . D 691.667 . . . Kiểm tra đồng nhất phương sai cho thấy không thể tiến hành kiểm tra Post hoc cho khauphan vì đơn vị đo độ tự do df2 = 0. Tuy nhiên, trong bảng kiểm tra các yếu tố ảnh hưởng Tests of Between-Subjects Effects vẫn cho thấy ảnh hưởng của khẩu phần và ảnh hưởng của khối là có ý nghĩa với mức ý nghĩa p tương ứng là 0.000 và 0.007. Nếu bỏ khoi ra khỏi ô Random factor và tiến hành phân tích chỉ ảnh hưởng của khauphan tới tăng trọng thì kết quả sau đây trong hộp thoại Output – SPSS Viewer: 20
CÓ THỂ BẠN MUỐN DOWNLOAD
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn