intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng - phương pháp thí nghiệm đồng ruộng - chương 6

Chia sẻ: Norther Light | Ngày: | Loại File: PDF | Số trang:17

223
lượt xem
58
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Chương VI PHÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Mục tiêu : Sinh viên nắm được ý nghĩa của phân tích tương quan và hồi qui. Biết được cách tính hệ số tương quan, cách đánh giá ý nghĩa của hệ số tương quan, cách lập phương trình hồi qui tuyến tính đơn (một biến số), biết ứng dụng chúng để phân tích kết quả nghiên cứu . 1. ĐẶT VẤN ĐỀ Trong thiên nhiên mọi hiện tượng và sự vật không phải độc lập mà liên quan với nhau rất mật thiết. Trong lĩnh vực sinh học cũng vậy,...

Chủ đề:
Lưu

Nội dung Text: Bài giảng - phương pháp thí nghiệm đồng ruộng - chương 6

  1. Chương VI P HÂN TÍCH TƯƠNG QUAN VÀ HỒI QUI Mục ti êu : Sinh viên nắm đ ược ý nghĩa của phân tích t ương quan và hồi qui. Biết được cách tính hệ số tương quan, cách đánh giá ý nghĩa của hệ số tương quan, cách lập phương trình hồi qui tuyến tính đ ơn (một biến số), biết ứng dụng chúng để phân tích kết quả nghiên cứu . 1. Đ ẶT VẤN ĐỀ Trong thiên nhiên mọi hiện tượng và sự vật không phải độc lập mà liên quan với nhau rất mật thiết. Trong lĩnh vực sinh học cũng vậy, các cá thể và qu ần thể trong quá trình phát sinh phát triển và tồn tại luôn có sự liên quan và ràng buộc lẫn nhau và quan hệ mật thiết với môi trường . Vì vậy, phân tích tương quan có thể giúp chúng ta dựa vào một đặc trưng hoặc một số đặc trưng nào đó đ ể đoán ra một đặc trưng khác và cũng nhờ phân tích tương quan như vậy giúp chúng ta phát hiện ra đ ược quy luật của sinh vật để hướng sự phát triển của chúng theo chiều hướ ng có lợi cho con người. Trong liên hệ hàm số thì với một giá trị của biến số độc lập ta có thể xác định được một trị số của biến số phụ thuộc tương ứ ng. Thí d ụ: Biết đường kính của đường tròn có thể xác định đ ược diện tích của nó. Quan hệ tương quan là quan hệ giữa một bên là biến số độc lập và một bên là số trung bình của những trị số của biến số phụ thuộc. P hương trình toán học biểu thị mối quan hệ đó gọi là phương trình hồi quy. Cho nên nhiệm vụ đầu tiên c ủa phân tích tương quan là xác đ ịnh các tham số của ph ương trình hồi quy. Từ mỗi biến số độc lập có thể có nhiều trị số của biến số phụ thuộc mà đ ại diện là số trung bình c ủa chúng. Nếu các trị số đó phân bố c àng t ập trung quanh trị số trung bình thì m ức độ liên hệ các biến số c àng chặt chẽ. Do đó nhiệm vụ thứ hai của phân tích tương quan là xác định mức độ liên hệ giữa các hiện t ượng. 2 . TƯƠNG QUAN TUYẾN TÍNH Đ ƠN 2.1 Khái ni ệm và các đặc trưng của tương quan Giả sử ta có một đám mây toạ độ Mi (Xi , Yi), đám mây có thể đ ược đại diện bằng đường thẳng D có phương trình y = ax + b (hình 1.6 và 2.6) Trên hình 1.6 mỗi điểm Mi có độ lệch ei đối với D; Trên hình 2.6 độ lệch ei là đoạn MiP i MiP i = Mi H - P i H ei = Yi – (ax + b) 77
  2. Vấn đề đặt ra l à xác đ ịnh đường D (nghĩa là ta tính a và b) thế nào cho tổng các bình phương đ ộ lệch e i nhỏ nhất. Đư ờng tìm ra được là đường thẳng các bình phương tối thiểu và phương pháp tính toán gọi là phương pháp bình phương tối thiểu. y Mi y Mi P1 e3 e1 y1 ei y Pi D D P 0 x 0 x xi x1 Hình 1.6 Hình 2.6 Nếu ta gọi Qyx là tổng bình ph ương các đ ộ lệch từ các điểm toạ độ đến đ ường D theo hướng trục y thì: 2 n  yi  ax i  b  Q yx = i 1 Trong đó: n là dung lượng mẫu quan sát. Như vậy Qyx là một hàm số của a và b. Qyx = f (a.b) Để cho đường D đại diện cho các điểm toạ độ thì phải l àm cho 2 n  y  ax  b  đ ạt giá trị cực tiểu Q yx = i i i 1 Muốn cho Qyx= f (a,b) là c ực tiểu thì điều kiện cần l à cho đ ạo h àm riêng theo a, b bằng không Q yx Q yx = 0 và =0 a b Q yx n y  ax i  bx = 0 Như vậy: = -2 i a i 1 Q yx n y  ax i  bx = 0 = -2 i b i 1 Từ (1) và (2) ta l ập được hệ phương trình tuyến tính đối với hai ẩn số a và b 78
  3. x y = a  X i2  b  X i i i y = a  X i  nb i Sau khi rút gọn hệ phương trình trên ta có:  x   y    a= (6-1) a  x  x  2 x y  xy  n a= (6-1) b  x 2 2 x  n Sau khi đã tính được a theo công thức (6 -1) ta có thể tính b theo công thức: b = y  xa (6-2) Đường D đi qua điểm p có toạ độ ( x, y ) trên hình 2.6 hệ số góc a của đ ường D bằng:   y y = a xx (6-3) Sau khi thiết lập được phương trình, ta cần kiểm tra để xác định giới hạn tin cậy của phương trình hồi quy tuyến tính và độ tin cậy của các hệ số trong phương trình. Xác đ ịnh độ tin cậy của ph ương trình hồi quy: D ùng phương pháp phân tích phương sai đ ể xác định độ tin cậy của ph ương trình hồi quy trên cơ sở của bảng phân tích phương sai sau: Nguồn biến Bậc tự do Tổng b ình Bình phương Fb ảng (5% đ ộng phương (SS) hoặc 1%) (df) trung bình Ftn (MS) Ngẫu nhiên n-k-1 MSE 2 y  yi  ˆ i (SSE) Hồi quy (SSR) K=1 SSTo - SSE MSR MSR/MSE  y  bộ Toàn n-1 2 y (SSTo) Trong đó:  y  =  y   y  /n 2 2 2 y  y   x  x / n    y  / n  a 2 2 2 y  yi  = 2 2 2 ˆ  i 79
  4. Xác đ ịnh độ tin cậy của các hệ số hồi quy: Nh ư đã trình bày ở trên phương trình hồi quy tuyến tính là một ước lượng của một hồi quy lý thuyết y trên x, đ ặc thù của đám đông lý thuyết mà đám đông th ực tế quan sát chỉ là một mẫu bất kỳ. Vậy ta phải xác định giới hạn tin cậy của ư ớc lượng ấy, để tránh những sai sót lớn nếu ta sử dụng một ước lượng không đúng. Trung bình c ủa bình phương những ˆ chênh lệch giữa những trị số yi ước lượng và yi t hực tế quan trắc l à: 2 y  yi   ˆ i 2 (6-4) s n2 Bậc tự do ở đây bằng n-2 vì trong n cặp so sánh  yi  y i  ta bị hai liên hệ ràng buộc ˆ là những phương trình tính y và x . Người ta đ ã chứng minh rằng: ph ương sai của hệ số hồi quy thực nghiệm được tính theo công thức: y  y  2 ˆ i i 2 (6-5)  S a ( n  2)  x  x  2 i   Và phương sai của b  y  a x là:  y  yi  ˆ2 i 2 (6-6)  S b n( n  2) 2 y  yi  ˆ Trong hai công thức (6-5) và (6 -6) số hạng mới cần phải tính l à i  y   x  x / n    y  / n  a 2 2 2 y  yi  = 2 2 2 ˆ  i Biết đ ược S a và Sb2 ta sẽ tính đ ược Sa và S b, sau đó tính t thực nghiệm để 2 kiểm định các giả thuyết a = 0 và b = 0 a a t a   t b   (6-7) Sa Sb Cuối cùng đối chiếu t thực nghiệm n ày với các trị số lý thuyết ( t  , n 2 ) ở bảng phụ lục và đưa ra kết luận. Vấn đề tiếp theo là tính hệ số tương quan. Trên hình (1.6) đường gấp khúc đi qua các điểm toạ độ M (x, y) l à D1. Để đánh giá D1 chênh lệch nhiều hay ít so với đ ường D nghĩa là cần biết mức độ tương quan giữa y và x ta không xét đ ến hệ số góc a của đ ường D m à nghiên cứu hệ số tương quan r. Sx (6-8) r a Sy Trong đó: Sx là độ lệch chuẩn của x 80
  5. Sy là độ lệch chuẩn của y Giá trị của r bằng a chia cho Sy/Sx nghĩa l à: r là giá trị của hệ số góc khi ta lấy Sx và Sy l àm đơn vị đo lường x và y. Như vậy, r không phụ thuộc vào các đơn vị đo lường của x và y như a, nhờ đó ta có thể lập đư ợc bảng r chung cho các trường hợp. Trong công th ức (6-8) ta có :  x   y  2 2 x y i i và Sx  Sy  n 1 n 1  x  2 x Sx i Nên :   y  y 2 Sy i Và thay thế a bằng giá trị của nó ta có :  x  x y  y  x  x  2 x i i i r  x  x   y  y 2 2 i i  x  2 Chia tử số và mẫu số cho  x thì công thức (6 -8) có dạng (6 -9) i  x  x  y  y  i i (6-9)a r  x  x    y  y  2 2 i i  xy   x  y  : n (6-9)b r  x     y  2 2   2 2  x    y   n  n      Căn c ứ vào công thức (6-9) ta thấy : giá trị của r luôn luôn nằm trong khoảng từ -1 đến +1. Người ta đ ã l ập bảng hệ số tương quan trong đó có những giá trị tuyệt đối của r ứ ng với bậc tự do bằng n-2 (n là số mẫu quan sát) với các mức xác suất khác nhau (xem b ảng 10 phụ lục). Bảng hệ số tương quan chỉ cho ta hai mức xác suất nhỏ là : 0,05 ; 0,01 và ứng với bậc tự do df 100 và mức xác su ất nhỏ
  6. y y x x Hình 3.6. Tương quan thuận Hình 4.6. Tương quan nghịch Từ công thức (6 -9) ta thấy rằng r có thể là dương (+), có thể là (-). Nếu r là (+) thì quan hệ giữa x và y là tương quan thuận, xem hình 3.6. Nếu r là (-) thì quan hệ giữa x và y nghịch, xem hình 4.6. Một cách khác để đánh giá hệ số tương quan giữa hai biến x và y được căn cứ trên tiêu chu ẩn sau : x và y không có quan hệ r=0 x và y có quan hệ h àm số r=1 x và y có quan hệ yếu 0  r  0,3 x và y có quan hệ vừa 0,3  r  0,5 x và y có quan hệ tương đối chặt 0,5  r  0,7 x và y có quan hệ chặt 0,7  r  0,9 x và y có quan hệ rất chặt 0,9  r  1 2.2 Các ví dụ minh họa 2.2.1. Trư ờng hợp dung l ượng mẫu nhỏ (n
  7.   y  y    y   y  : n  63693  1147,8 : n  958 2 2 2 2  x  x y  y    xy   x  y  : n  59,74  1,08  1147,8 : 21  0,55 Tính hệ số tương quan và phương trình hồi quy theo công thức (6 -1, (6-3) và (6-9) B ảng 1.6. Quan hệ giữa lân tổng số và năng su ất lúa của 21 mẫu phân tích Thứ tự Năng su ất Bình phương P 2O5 % (x) xy (y )(tạ/ha) y2 x2 1 0,058 63,7 0,003364 4057,69 3,6946 2 0,057 62,3 0,003249 3881,29 3,5511 3 0,035 56,2 0,002909 3203,56 2,9998 4 0,054 58,6 0,002916 3433,96 3,1144 5 0,046 48,1 0,002116 2313,61 2,2126 6 0,048 45,3 0,002304 2052,09 2,1744 7 0,051 53,8 0,002601 2894,44 2,7438 8 0,045 45,3 0,002025 2052,09 2,0385 9 0,050 52,4 0,002500 2745,76 2,6200 10 0,056 60,9 0,003136 3708,81 3,4104 11 0,056 60,0 0,003136 3600,00 3,3600 12 0,055 60,0 0,003025 3600,00 3,3000 13 0,049 46,7 0,002401 2180,89 2,2883 14 0,050 51,6 0,002500 2662,56 2,5800 15 0,052 53,8 0,002704 2894,44 2,7976 16 0,045 43,9 0,002025 1927,21 1,9755 17 0,057 55,0 0,003249 3025,00 3,1350 18 0,056 62,3 0,003136 3881,29 3,4888 19 0,058 56,0 0,003364 3136,00 3,2480 20 0,058 66,6 0,003364 4435,56 3,862 8 21 0,047 45,3 0,002209 2052,09 2,1291 Tổng 1,038 1.147,8 0,056549 63.693,22 59,7419 83
  8.  x  x y  y  0,55 i i r   0,567  x  x   y  y  2 2 0,001  958 i i  x  x y  y   0,55  550 a  x  x  2 0,001   Ta có : y  y  a x  x  54,6  550 x  0,054  y  550 x  25 Kiểm tra mức độ tin cậy của phương trình hồi quy, theo bảng phân tích phương sai (b.1.6a) cho thấy giá trị F bảng nhỏ h ơn Ftn vậy hồi quy có ý nghĩa ở mức tin cậy 95%. Kiểm tra mức độ tin cậy của các hệ số hồi quy. Theo các công thức (6-5) ; (6-6) ; (6-7) ta có : B ảng 1.6a. Bảng phân tích ph ương sai Nguồn biến Bậc tự do Tổng bình phương Bình phương Ftn Fbản g động (df) (SS) trung bình (5%) (MS) Toàn bộ n-1=20  y 2 y  958 (SSTo) Hồi quy K=1 SSTo – SSE = 302 302 8,7 4,38 (SSR) Ngẫu nhiên n-k-1=19 34,5 2 y  y i  =656 ˆ i (SSE 2 2  ( y )   (  x)    2 2 2  y i    a   xi   n  958  550  0,001 n  656     2 Sa    34526 2  (  x)  19  0,001 0,019 n  2   xi2    n   Với S a = 185,8 2 2  ( y )    ( x )   2  y i    a   xi  2 2   n n    656  1,64    2 Sb  nn  2  21x19 84
  9. Với S b = 1,28 a 550 ta    2 ,9 6 S a 185,5 b 25 tb    3,91 S b 1, 28 t0,01, 19 = 2,816 (bảng 4 phụ lục) Kết luận :Phương trình hồi quy giữa năng suất luá và hàm lượng lân ở trong đất tin cậy ở m ức xác suất P= 0,09 Hệ số r tra bảng ứng với độ tự do df = n-2 = 19 và mức ý nghĩa   0,01 bằng 0,5487. Như vậy, hệ số r tính >r lý luận, ta có thể kết luận tương quan giữa lân ở trong đất và năng su ất lúa là rõ với mức tin cậy 95%. 2.2.2. Trư ờng hợp dung l ượng mẫu lớn (n>30) Trong trường hợp nhiều số liệu (n lớn), ta lập một bảng hai chiều gọi là bảng tương quan. Cách l ập bảng tương quan như trong bảng 2.6, bảng được chia thành nhiều ô, mỗi ô chứa tần số nij có hai giá trị xi và yi của hai đặc tính x và y. Các giá trị của x và y trình bày trong b ảng l à các giá trị giữa của từng tổ. Cách tính hệ số tương quan trong trường hợp n lớn m à số liệu được phân th ành từng tổ, cũng như khi tính số trung bình và độ lệch chuẩn, ta đổi gốc toạ độ đ ể tính các phép tính trên biến số mới Xi và Yi. B ảng 2.6. Bảng hai chiều Y X Tổng fy xi yi nij Tổng fx n y i  Ay xi  Ax Xi  ; Yi  Cx Cy x  Ax  C x  f x X i  : n Do đó : y  Ay  C y  f y Yi  : n 85
  10.  f X   x  x  2   f x X i  : n 2  C x2 2 x i   y  y   C  f Y   f Y  : n  2 2 2 2 yx y i yi  x  x   y  y   C C  fX Y   f X   f Y  : n x y i i x i y i Thí d ụ: N ghiên cứu mối quan hệ giữa h àm lượng chất hữu cơ trong đ ất (OM) là x và hàm lượng lân y (miligam) trên 100 gam đ ất. Kết quả phân tích 64 mẫu đ ược ghi trong bảng 3.6. Các bư ớc tính toán nh ư sau : B ảng 3.6. Kết quả phân tích mẫu Mẫu Mẫu Mẫu Mẫu OM Lân OM Lân OM Lân OM Lân đất đất đất đất x% y x% y x% y x% y 1 1,57 30 17 1,35 17 33 0,96 6 49 1,42 27 2 1,58 28 18 1,31 17 34 1,08 9 50 1,36 25 3 1,1 25 19 1,29 16 35 1,16 19 51 1,55 24 4 1,21 27 20 1,38 17 36 1,12 17 52 1,36 22 5 1,44 25 21 1,38 16 37 1,01 11 53 1,46 28 6 1,37 24 22 1,36 14 38 1,07 11 54 1,39 28 7 1,45 25 23 1,36 16 39 1,10 16 55 1,63 36 8 1,49 27 24 1,20 17 40 1,22 17 56 1,57 36 9 1,38 24 25 1,36 16 41 1,22 16 57 1,37 27 10 1,41 25 26 1,29 14 42 1,12 19 58 1,48 25 11 1,55 25 27 1,30 12 43 0,86 20 59 1,61 28 12 1,45 25 28 1,32 12 44 0,79 19 60 1,61 30 13 1,30 22 29 1,17 11 45 1,19 23 61 1,70 28 14 1,30 22 30 1,22 11 46 1,15 22 62 1,61 28 15 1,39 20 31 1,09 9 47 1,13 18 63 1,04 9 16 1,46 22 32 1,13 9 48 1,34 20 64 1,12 10 Lập bảng phân tổ hai chiều : + Chia tổ cho từng dãy biến số, ta thấy n = 64 như vậy ta có thể chia các dãy số liệu trên thành 6 đ ến 8 tổ. Để cho các số liệu thực tế nằm gọn trong các tổ ta lấy số tổ ứng với biến số x là 7 và biến số y l à 6. Nên khoảng cách tổ như sau : 86
  11. X max  X min 1,70  0,79 0,91 Cx    68 68 7 Ymax  Ymin 36  6 30 Cy     5mg 68 68 7 B ảng 4.6. Bảng phân tổ hai chiều cho các đại l ượng x và y tính từ bảng 3.6 Tổng x 0,79- 0,92- 1,05- 1,18- 1,31- 1,44- 1,57- 0,91 1,04 1,17 1,30 1,43 1,56 1,70 fy Trị số giữa tổ y 0,58 0,98 1.11 1.24 1.37 1.50 1.64 36-31 33 2 Trị 30-26 28 1 3 2 12 số 25-21 23 1 4 5 7 17 giữa 20-16 18 2 5 4 8 20 tổ 15-11 13 2 3 2 9 1 0 -6 8 3 1 4 Tổng 2 3 11 13 18 9 8 64=n fx Căn cứ vào các số tổ và kho ảng cách tổ ta lập bảng phân tổ hai chiều bằng cách đ ịnh giới hạn tổ, tính các trị số giữa tổ, tần số của từng tổ ứng với các biến số và tổng tần số nh ư bảng 4.6 Từ số liệu ở bảng 4.6 ta lập bảng phân tổ hai chiề u theo biến số mới và lập bảng tính các tổng theo công thức tính r và a, b c ủa phương trình y = ax + b (b ảng 5.6) Trong bảng 5.6 chọn A(x) = 1,24 và A(y) =18 Tính biến số mới theo công thức: yi  18 xi  1, 24 Yi  Xi  5 0,13 - Tính các tích số fxXi và fyYi và các tổng: ∑fxXi = 37; ∑fyYi = 30 - Tính các tích số fxXi2 và fyYi2 và các tổng ∑fxXi2 = 167; ∑fyYi2 =110 - Tính các tích số fXi Yi và tổng ∑fX i Yi = 96. - Trong đó f là tần số ở từng ô ứng với từng giá trị Xi và Yi. 87
  12. B ảng 5.6. Bảng tính hệ số tương quan và phương trình hồi quy theo bi ến số mới Xi Yi Xi X  1,24 -3 -2 -1 0 1 2 3 0,13 Fy FyYi X 0,85 0,98 1,11 A x=1,24 1,37 1,50 1,63 Y  18 Yi  5 Y 3 33 2 2 6 2 28 2 1 1 1 3 2 6 12 24 1 23 2 5 4 5 7 17 17 0 Ay=18 2 4 8 20 9 -1 13 3 3 2 9 -9 -2 8 1 4 -8 fx 2 3 11 13 18 9 8 n=64 30= ∑fyYi 37= ∑fxXi fxXi -6 -6 -11 0 18 18 24 167= ∑fxXi 2 fxXi 2 18 12 11 0 18 36 72 96= ∑fXi Yi fXi Yi 0 4 7 0 9 22 54 Chú ý : fx, fy ho ặc f ký hiệu ở chương này tương tự với ký hiệu ni (tần số) ở các chương khác. Cách tính như sau: Tổ 1: fX i Yi = 2 x (-3) x 0 = 0 Tổ 2: fXi Yi = 1 x (-1) x 0 + 2 x (-2) x (-1) = 4 Tổ 3: fXi Yi = 1 x (-1) x 1 + 5 x (-1) x 0 + 2 x (-1) x (-1) + 3 x (-1) x (-2) = 7 …… Tổ 7: fXi Yi = 2 x 3 x 3 + 6 x 3 x 2 = 54 Tính x và y y  A y C y  f y Yi : n y  18  5  30 : 64  20,3m g x  A x C x  f x X i : n x  1,24  0,13  37 : 64  1,32 % Tính các tổng: 88
  13.  x  x   fxX  ( fxX ) : n  0,13 167  37 : 64  2, 46 2  C x2 2 22 2 2 i i   y  y   C  fyY  ( fyY ) : n  5 110  30 : 64  2398,5 2 2 2 22 2 2 y i i  x  x y  y   C C  fX Y   fxX  fyY  : n  0,13  596  37  30 : 64  51,13 y x x y i i Tính hệ số tương quan và phương trình hồi quy:  x  x  y  y  51,13 r   0,67  x  x    y  y  2 2 2, 46  2398,5  x  x y  y   51,13  20,08mg ay  2 2, 46  ( x  x) x   y  y  a y x  x  20,3  20,8x  1,32   20,8 x  7,2. x Kiểm tra mức độ tương quan và giới h ạn tin cậy của phương trình theo các công thức (6.5*, (6.6) và 6.7).  f Y   f X    f y Yi  : n  a 2C x2   f x X i  : n 2 2 C y2 2 2 yi x i 2 S n  2 C 2  f x X i2   f x X i   a 2 :n x 2398,5  20,8 2  2,46 1334,2    8,74 62  2, 46 152,5 Sa = 2,956  f Y   f X    f y Yi  : n  a 2C x2   f x X i  : n 2 2 C y2 2 2 yi x i 2 S b n  2 n 2398,5  20,8 2  2,46 1334, 2    0,336 62  64 62  64 Sb = 0,58 20,8 7 ,2 ta   7,03; t b   12,41 2,956 0,58 T0,01. 62 = 2,576 tra bảng 4 phụ lục. Như vậy : ta và t b lớn hơn t l ý luận. Kết luận: Phương trình hồi quy giữa h àm lượng chất hữu c ơ và hàm lượng lân ở trong đất tin cậy được ở mức xác suất P = 0,99. Hệ số r tra bảng phụ lục 10(ứng với độ tự do (n-2 = 62 và mức xác suất α = 0,01) bằng 0,3248. 89
  14. Như vậy : r tính > r lý lu ận, ta có thể kết luận rằng t ương quan giữa lân ở trong đất và hàm lượng chất hữu có là r ất chặt. Chú ý: Ta cũng có thể tính gần đúng hệ số tương quan theo công th ức tính tương quan thứ tự của Spearman. 6 d 2 r 1   n n 2 1 Trong đó : d : l à hiệu số các trị số thứ tự của các cặp tương quan. n : l à số cặp tương quan. Tính hệ số tương quan theo phương pháp của Spearman t ương đối đ ơn giản, rút ng ắn đ ược thời gian. Nhưng nó chỉ có lợi khi ta không cần phải xây d ựng phương trình hồi quy. Còn trong tính toán c ần thiết phải xây dựng phương trình hồi quy thì không nên áp d ụng phương pháp này. Trị số r tính đ ược ở trên được so sánh với trị số r lý luận ở bảng phụ lục để đánh giá mức độ quan hệ. Ta có thể tìm hiểu nội dung chi tiết của phương pháp thông qua ví dụ sau : Thí du : N ghiên cứu mối tương quan giữa lư ợng m ưa (x) và năng su ất lúa (y) kết quả ghi lại như bảng 6.6. Từ số liệu quan sát đ ược, ta đem sắp xếp theo thứ tự từ nhỏ đến lớn và ghi số liệu thứ tự của x và y vào bảng. Trường hợp khi số thứ tự trùng nhau thì ký hiệu số thứ tự l à số trung bình c ủa thứ tự các số liệu trùng nhau. Thí dụ năm 1909 và 1993 đ ều có lượng mưa là 108 mm. Theo th ứ tự thì số 108 sẽ lần lư ợt chiếm hai số thứ tự l à 7 và 8, vấn đề đặt ra l à thứ tự 7 nằm ở năm nào ? vì vậy ta phải xếp thứ tự trung bình là 7,5 để xếp. Thay các trị số đã tính được vào công thức ta đư ợc : 6  813 r 1  0,72   26 26 2  1 Tra bảng phụ lục 10 khi độ tự do df = n - 2 = 26 - 2 = 24 ta có r01 = 0,487 như vậy r tính lớn hơ n r01 Do vậy ta có thể kết luận chắc chắn rằng giữa l ượng mưa và năng su ất có quan hệ chặt.(Bảng 6.6). Chú ý: Trong một số trường hợp chúng ta phải so sánh hai hệ số tương quan xem có giống nhau hay khác nhau. Vì r không phân phối chuẩn nên phải biến đổi. 1 1 r trư ớc khi so sánh, giá trị z đ ược cho trong bảng 12 phụ lục, z ln 2 1 r Từ giá trị của r1 ta tìm được z1. 90
  15. Từ giá trị của r2 ta tìm được z2. Độ lệch chuẩn Sz1 và Sz2 được tính theo công thức : 1 Sz z  n1  3 1 S z2  n2  3 Sở dĩ bậc tự do ở đây b ằng n -3 vì trong quá trình tính z ta ph ải trải qua 3 bước, mất một độ tự do khi tính trung bình, một trong khi tính hệ số tương quan và một khi đổi giá trị từ r và z. Độ lệch chuẩn của hiệu z1-z2 được tính theo công thức: 1 1 S( z1  z2 )   n1  3 n2  3 Trong đó n1 : số cặp t ương quan r1 n2 : số cặp t ương quan r2 Trị số t thực nghiệm đ ược tính theo công thức z1  z 2 d ttn =  S( z1  z2 ) 1 1  n1  3 n2  3 Trị số ttn được so sánh với trị số t trong bảng ở mức ý nghĩa nhỏ (0,05 hoặc 0,01) và b ậc tự do tương ứ ng bằng df = n1+ n2 - 6. Nếu: ttn>tbảng thì ta kết luận hai hệ số tương quan nghiên c ứu khác nhau rõ rệt. ttn
  16. B ảng 6.6. Nghi ên cứu mối quan hệ giữa l ượng m ưa x (mm) và năng suất y (tạ/ha). d2 Năm Trị số quan sát Thứ tự D x Y x y 1911 71 16,6 1 2 -1 1 1915 89 16,4 2 1 +1 1 1901 96 25,0 3 10 -7 49 1917 98 19,2 4 3 +1 1 1903 105 26,2 5 13,5 -8,5 72 1918 106 20,2 6 6 0 0 1913 108 19,4 7,5 4 +3,5 12 1909 108 22,6 7,5 8 -0,5 0 1925 110 30,2 9,0 17 -8 64 1906 111 19,6 10 5 +5 25 1912 119 29,6 11 16 -5 25 1919 123 25,6 12 11 +1 1 1914 132 30,6 13 20 -7 49 1905 135 20,4 14 7 +7 49 1910 137 24,2 15 9 +6 36 1902 144 32,6 16 23 -7 49 1916 147 30,4 17,5 18,5 -1 1 1924 147 30,4 17,5 18,5 -1 1 1920 156 31,0 19 21 -2 4 1907 161 33,8 20 25 -5 25 1922 162 31,6 21 22 -1 1 1900 177 26,2 22 12 +10 100 1921 191 35,8 23 26 -3 9 1906 209 29,2 24 15 +9 81 1923 235 33,6 25 24 +1 1 1908 246 26,6 25 24 +1 1 92
  17. Tra bảng t ương ứ ng với r1= 0,738 ta có z1= 0,9505 r2= 0,808 ta có z2= 1,1270 d= z2- z1= 1,1270 -0,9505= 0,1765 1 1 S( z1  z 2 )    0,1841 63  3 61  3 d 0,1765 ttn =  0,958  S ( z1  z2 ) 0,1841 t0,05. 118 = 1,96 ttn
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2