Hàm ngẫu nhiên B-spline và ứng dụng vào dự báo

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:8

Thêm vào BST

Báo xấu

39
lượt xem 1
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết đưa ra khái niệm hàm ngẫu nhiên B-spline ứng với mẫu thực nghiệm của đại lượng ngẫu nhiên hai chiều (X,Y) và chứng tỏ hàm ngẫu nhiên này phản ảnh tốt mối quan hệ giữa X và Y trong trường hợp hệ số tương quan R(X,Y) bé, để chứng tỏ điều này chúng tôi đã nêu và chứng minh định lí.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Hàm ngẫu nhiên B-spline và ứng dụng vào dự báo

32 TRƯỜNG ĐẠI HỌC PHÚ YÊN HÀM NGẪU NHIÊN B-SPLINE VÀ ỨNG DỤNG VÀO DỰ BÁO Lê Hào* Tóm tắt Trong bài báo này, chúng tôi đưa ra khái niệm hàm ngẫu nhiên B-spline ứng với mẫu thực nghiệm của đại lượng ngẫu nhiên hai chiều ( X , Y ) và chứng tỏ hàm ngẫu nhiên này phản ảnh tốt mối quan hệ giữa X và Y trong trường hợp hệ số tương quan R( X , Y ) bé, để chứng tỏ điều này chúng tôi đã nêu và chứng minh định lí (2.4). Trong phần áp dụng, chúng tôi sử dụng định lí (2.4) để thiết lập hàm hồi quy B-spline cho việc dự báo. Từ khóa: Hàm ngẫu nhiên B-spline, hàm hồi quy B-spline, hệ số tương quan, mẫu thực nghiệm, biến số ngẫu nhiên. 1. Giới thiệu Việc áp dụng mô hình hồi quy phù hợp để dự báo mối tương quan của hai đại lượng ngẫu nhiên X , Y là việc rất khó khăn, thông thường khi hệ số tương quan R( X , Y ) quá gần 0 thì việc sử dụng một số mô hình hồi quy đã biết có thể cho ta những dự báo sai lệch lớn, ngoài ra việc cập nhật cho các mô hình hồi qui thường gặp trở ngại khi các dữ liệu được cập nhật liên tục. Trong bài báo này, chúng tôi đề cập đến kiểu hàm y( x)  f ( x, Y ) ( x  D  ) trong đó Y là một đại lượng ngẫu nhiên, có nghĩa là ứng với mỗi giá trị x  D cụ thể thì y( x) là một đại lượng ngẫu nhiên. Hàm như thế gọi là hàm ngẫu nhiên, có vai trò rất lớn trong thống kê ứng dụng. Bài báo đề cập đến một hướng giải quyết vấn đề nói trên, thông qua việc khảo sát hàm ngẫu nhiên B-spline và áp dụng vào dự báo. 2. Các khái niệm và định lý Trong [2] chúng tôi đã đề cập đến khái niệm và công thức của đường cong B-spline bậc 2 đi qua tất cả các điểm nút Pk ( xk , yk ) (k  0,..., n) cho trước. Đó là đường cong tham số P(t )  ( x(t ), y(t )) gồm n  1 cung Bezier ghép trơn, được xác lập bởi công thức: P(t )  S0 (1  t )2  2T1t (1  t )  S1t 2 khi 0  t  1 P(t )  S1 (2  t ) 2  2T2 (t  1)(2  t )  S2 (t  1) 2 khi 1  t  2 P(t )  S2 (3  t ) 2  2T3 (t  2)(3  t )  S3 (t  2) 2 khi 2  t  3 (2.1) ........ P(t )  Sn3 (n  2  t ) 2  2Tn2 (t  n  3)(n  2  t )  Sn2 (t  n  3) 2 khi n  3  t  n  2 P(t )  Sn2 (n  1  t )2  2Tn1 (t  n  2)(n  1  t )  Sn1 (t  n  2) 2 khi n  2  t  n  1 Trong đó S0  P0 , Sn1  Pn và S1 , S2 ,..., Sn2 lần lượt là trung điểm của các đoạn thẳng _________________________ * ThS, Trường Đại học Phú Yên
TẠP CHÍ KHOA HỌC SỐ 13 * 2016 33 T1T2 , T2T3 ,..., Tn2Tn1 . Các điểm T1 , T2 ,..., Tn1 được xác định bởi hệ sau (để đảm bảo đường cong đi qua mọi điểm nút Pk ): 5T1 T2  8P1  2 P0 T1 6T2 T3  8P2 T2 6T3 T4  8P3 (2.2) ... ... ... ... ... ... ... ... Tn 3 6Tn  2 Tn 1  8Pn 2 Tn 2 5Tn 1  8Pn 1  2 Pn Khi các nút P0 , P1 ,..., Pn tương ứng có hoành độ tăng dần x0  x1  ...  xn thì hàm x  x(t ) tăng, khi đó công thức (2.1) của đường B-spline xác định hàm y  L( x) ( x0  x  xn ) có đạo hàm liên tục mọi cấp trên đoạn  x0 , xn  và sup L( n ) ( x)  M   (n  ) ( xem [2] ). x0  x  xn Tiếp theo ta xét ( X , Y ) là đại lượng ngẫu nhiên hai chiều có hệ số tương quan R( X , Y ) khá bé, X là biến ngẫu nhiên nhận giá trị trong ( x0 ; ) và ( x0 , y0 ), ( x1 , y1 ), ..., ( xn1 , yn1 ) là mẫu cụ thể đã biết của ( X , Y ) với x0  x1  ...  xn 1 . Giả sử cần quan sát mối quan hệ giữa X , Y khi X nhận giá trị trong khoảng  x0 , d  chứa tất các mốc xk (k  0,..., n  1) , ta chọn thêm mốc xn  d . Định nghĩa 2.3. Với mẫu đã nói trên, hàm ngẫu nhiên B-spline là hàm y  L( x) được xác định từ công thức (2.1) của đường cong B-spline bậc hai đi qua các nút: P0 ( x0 , y0 ), P1 ( x1 , y1 ),..., Pn 1 ( xn 1 , yn 1 ), Pn ( xn , Y * ) Trong đó Pn ( xn , Y * ) là điểm ngẫu nhiên với Y *  aX  b là đại lượng ngẫu nhiên xác định bởi công thức hồi quy của Y qua X theo nguyên tắc bình phương bé nhất, nghĩa là: DY a , b  EY  aEX DX Cov( X , Y ) E ( XY )  EX.EY và   R( X , Y )   DX . DY EX  ( EX )2 . EY2  ( EY )2 2 Trên phương diện lý thuyết mối quan hệ giữa X , Y được thể hiện bằng đường cong lý thuyết y  f ( x) đi qua các nút đã biết ( x0 , y0 ), ( x1 , y1 ),..., ( xn 1 , yn 1 ) và nút chưa biết ( xn , Y ), ta xem nút ( xn , Y ) là cặp giá trị giả định của đại lượng ngẫu nhiên ( X , Y ) tại mốc X  xn  xn1 . Nếu cần ta xấp xỉ f ( x) bằng hàm B-spline đi qua vô số điểm nút của f ( x) nên ta xem hàm f ( x) có đạo hàm liên tục mọi cấp trên đoạn  x0 , xn  .
34 TRƯỜNG ĐẠI HỌC PHÚ YÊN Hàm f ( x) có đa thức nội suy với các nút ( x0 , y0 ),..., ( xn 1 , yn 1 ), ( xn , Y ) là hàm ngẫu nhiên, xác định như sau: ( x  x1 )( x  x2 )...( x  xn ) ( x  x0 )( x  x2 )...( x  xn ) Pf ( x, ( x0 , xn ,..., xn ))  y0  y1  .... ( x0  x1 )( x0  x2 )...( x0  xn ) ( x1  x0 )( x1  x2 )...( x1  xn ) ( x  x0 )( x  x1 )...( x  xn  2 )( x  xn ) ( x  x0 )( x  x1 )...( x  xn 1 )  yn 1 Y (x  ) ( xn 1  x0 )( xn 1  x1 )...( xn 1  xn  2 )( xn 1  xn ) ( xn  x0 )( xn  x1 )...( xn  xn 1 ) Hàm B-spline L( x) có đa thức nội suy với các nút ( x0 , y0 ),..., ( xn 1 , yn 1 ), ( xn , Y * ) cũng là hàm ngẫu nhiên, xác định như sau: ( x  x1 )( x  x2 )...( x  xn ) ( x  x0 )( x  x2 )...( x  xn ) PL( x, ( x0 , xn ,..., xn ))  y0  y1  .... ( x0  x1 )( x0  x2 )...( x0  xn ) ( x1  x0 )( x1  x2 )...( x1  xn ) ( x  x0 )( x  x1 )...( x  xn  2 )( x  xn ) ( x  x0 )( x  x1 )...( x  xn 1 )  yn 1 Y* (x  ) ( xn 1  x0 )( xn 1  x1 )...( xn 1  xn  2 )( xn 1  xn ) ( xn  x0 )( xn  x1 )...( xn  xn 1 ) Việc sử dụng hàm L( x) để phản ánh mối tương quan X và Y có hợp lí hay không? Để trả lời cho câu hỏi đó chúng tôi tìm hiểu sự liên hệ giữa các hàm ngẫu nhiên L( x) , f ( x) và có kết quả sau: Định lý 2.4. Với mọi x   x0 , xn  thì: n  xx j E  L( x)  f ( x)   j 0 sup E  L( n 1) (t )  f ( n 1) (t )  (n  1)! x0 t  xn   n 1  xx 2 sup E  L( n 1) (t )  f ( n 1) (t )    j n E  L( x)  f ( x)   min E Y   X     j 0 x t  x  x  xj 2 2 0 n n 1  , (n  1)!  ( xn  x j ) j 0 j 0 Chứng minh. n L( x)  PL( x;( x0 ,..., xn 1 , xn ))   ( x  x j ). n 1L( x0 ,..., xn 1, xn , x) (1) j 0 n f ( x)  Pf ( x;( x0 ,..., xn 1 , xn ))   ( x  x j ). n 1 f ( x0 ,..., xn 1 , xn , x) (2) j 0 Từ (1) và (2) suy ra: n 1  (x  x ) j Y *  Y    ( x  x j )   n1L( x0 ,..., xn , x)   n1 f ( x0 ,..., xn , x)  n j 0 L( x)  f ( x)  n 1 (3)  (x j 0 n  xj ) j 0 Áp dụng định lí Hermite – Genocchi ( xem [1] ) luôn tồn tại 1 , 2  x0 , xn  sao cho:
TẠP CHÍ KHOA HỌC SỐ 13 * 2016 35 E  L( n1) (1 )  f ( n1) (1 )  E  L( x0 ,.., xn , x)   n 1 n 1 f ( x0 ,..., xn , x)   (4) (n  1)! 2 2 E  L( n 1) ( 2 )  f ( n 1) ( 2 )  E   L( x0 ,.., xn , x)   n 1 n 1 f ( x0 ,..., xn , x)   (5) (n  1)! Từ (3) (4) và do E (Y *  Y )  E (aX  b  Y )  0 nên: n  xx j E  L( x)  f ( x)   j 0 sup E  L( n 1) (t )  f ( n 1) (t )  (n  1)! x0 t  xn Mặt khác từ (3) (5) và để ý E  XY   EX 2 EY 2 ( với mọi véc tơ ngẫu nhiên ( X , Y ) ) nên:   n 1  xx 2 j sup E  L( n 1) (t )  f ( n 1) (t )  E Y *  Y   n E  L( x)  f ( x)    j 0 2 x t  x x  xj 2 0 n n 1 (n  1)!  ( xn  x j ) j 0 j 0 Hay nói cách khác:   n 1  xx 2 sup E  L( n 1) (t )  f ( n 1) (t )    j n E  L( x)  f ( x)   min E Y   X     j 0 x t  x  x  xj 2 2 0 n n 1  ,  (n  1)!  ( xn  x j ) j 0 j 0 Nhận xét 2.5. Với X  x  x0 ; xn  thì: x  xj Do x0  x1  ...  xn 1  xn và giảm theo x j nên với mọi x   x0 , xn  ta có: xn  x j x  x0 x  xj x  xn1 a   b (j  0,1,..., n  1) xn  x0 xn  x j xn  xn1 x  xj x  xj  A  max(a, b)   max(a, b)   A hay  A (j  0,..., n  1) xn  x j xn  x j n 1  xx j 0 j  x  x0 x x  Suy ra: n 1  An Với A  max  , n1   xn  x0 xn  xn1   n j ( x j 0  x )
36 TRƯỜNG ĐẠI HỌC PHÚ YÊN x  xn1 x  xn1 Nếu ta chọn X  x   2xn1  xn , xn  thì: 1< 1 1 0  A 1 xn  xn1 xn  xn1 nên khi n tiến ra vô cùng ta có: n 1 n  xx j 0 j  xx j 0 j xn  x0 n 1 n 1  A  0 và n  0 (n  1)! (n  1)!  (x j 0 n  xj ) Hàm ngẫu nhiên B-spline L( x) phản ánh tốt mối quan hệ giữa các đại lượng ngẫu nhiên n 1 n  j 0 x  xj  xx j 0 j X,Y tại những giá trị x có n 1 và bé. (n  1)!  (xj 0 n  xj ) Hàm L( x) cũng phản ánh tốt mối quan hệ giữa X,Y tại những giá trị x   2xn1  xn , xn  nếu chọn kích thước mẫu n đủ lớn. 3. Áp dụng 3.1. Hàm hồi quy B-spline và đường hồi quy B-spline Trên phương diện thực nghiệm, nếu biết ( x0 , y0 ), ( x1 , y1 ), ..., ( xn1 , yn1 ) là mẫu thực nghiệm của vectơ ngẫu nhiên (X,Y) với x0  x1  ...  xn 1 , ta có thể tiến hành dự báo các giá trị của Y khi X   x0 , d  ( x0  x1...  xn1  d ) theo cách sau: Lập thêm mốc xn  d và xác định thêm điểm nút Pn ( xn , y * ) thỏa mãn: Y y*  axn  b và a  r , b  Y  aX X với r là hệ số tương quan thực nghiệm của X , Y ứng với mẫu thực nghiệm đã cho. Lập hàm B-spline y  L( x) theo công thức (2.1) có đồ thị là đường B-spline đi qua tất cả các điểm P0 ( x0 , y0 ), P1 ( x1 , y1 ),..., Pn 1 ( xn 1 , yn 1 ), Pn ( xn , y * ). Hàm y  L( x) đó được gọi là hàm hồi quy B-spline ( thực nghiệm ) của Y theo X, đồ thị của nó gọi là đường hồi quy B-spline. Từ công thức của hàm hồi quy này ta có thể dự báo giá trị Y  L( x) khi X  x  ( x0 , d ) . 3.2. Bài toán Bài toán. Quan sát mối quan hệ giữa X,Y trong đại lượng ngẫu nhiên hai chiều người ta thu được mẫu sau: X 10 40 80 110 150 190 220 260 300 340 380 Y 200 230 250 240 180 160 150 190 200 280 300 400 420 450 480 530 570 600 640 680 720 760 800 320 290 310 270 200 180 160 200 230 250 290 270
TẠP CHÍ KHOA HỌC SỐ 13 * 2016 37 Hãy lập các dự báo về giá trị của Y khi X  x  10; 900 Bước 1. Lập thêm một nút dự báo tại mút xn  900 của khoảng quan sát 10; 900 Từ mẫu trên ta tính được hệ số tương quan thực nghiệm r  0, 245123532 và các thông số khác như sau: Y ar  0.053163965, b  Y  a X  211.5049132, y*  axn  b  259.3524814 X và lập thêm nút Pn (900, 259.3524814) Bước 2. Lập công thức của đường hồi quy B-spline đi qua các nút Pk ( xk , yk ) (k  0,..., n) Trong đó các nút P0 , P1 ,..., Pn 1 ứng với các cặp giá trị của mẫu đã cho và nút Pn vừa lập ra trong bước 1. Sử dụng công thức (2.2) ta dễ dàng lập được một thuật toán đơn giản cho máy tính để tìm các bộ ba điểm cơ sở cho 22 cung Bezier được ghép trơn, cụ thể các bộ ba điểm đó là: Phương trình của đường hồi quy B-spline được xác định từ công thức (2.1), trong đó mỗi thành phần của công thức có các điểm cơ sở Si , Ti 1 , Si 1 đã xác định như trên. Bước 3. Lập giá trị dự báo của Y ứng giá trị X  x  (10, 900) Ta dễ dàng lập một thuật toán để biết chính xác giá trị X  x ứng với cung Bezier nào
38 TRƯỜNG ĐẠI HỌC PHÚ YÊN trong số 22 cung có các điểm cơ sở đã lập, sau đó tìm giá trị t tương ứng với x, rồi suy ra giá trị dự báo y  y(t ) của Y. Đoạn chương trình ngắn gọn sau sẽ giúp ta làm việc này: PROCEDURE TIMGIATRI(L:word; GTX:real; var GTY:real); Var i:integer; Heso1,Heso2,Heso3, Delta,t1:real; Begin i:=0; While (S[i].x < Gtx) and (i
TẠP CHÍ KHOA HỌC SỐ 13 * 2016 39 4. Kết luận Về mặt lý thuyết: chúng tôi đã nêu và chứng minh định lí 2.4, để chứng tỏ rằng hàm ngẫu nhiên B-spline có thể phản ánh tốt mối quan hệ giữa X và Y. Về mặt thực nghiệm: Sử dụng định lí 2.4 chúng tôi đã nêu ra khái niệm hàm hồi qui B-spline y  L( x) và ứng dụng vào dự báo, cho thấy mô hình hồi qui này có thể áp dụng cho mọi kiểu dữ liệu hai chiều, đường hồi qui vạch qua mọi nút dữ liệu ( xi , yi ) và hàm hồi quy y  L( x) có thể dễ dàng được cập nhật TÀI LIỆU THAM KHẢO [1] W. Kahan and Richard J.Fateman (1999), Symbolic computation of divided differences, University of California, Berkeley. [2] Lê Hào (2012), Đường cong B-spline, lý thuyết lập trình và ứng dụng, Đề tài nghiên cứu khoa học cấp trường, Trường Đại học Phú Yên. [3] Lê Hào (2009), Đường cong B-spline và ứng dụng trong đồ họa 3D, Thông báo khoa học số 04/2009, Phú Yên. [4] Lê Đức Thoang (2015), Giáo trình phương pháp tính, Trường Đại học Phú Yên. [5] D.I. Kazakevits (2004), Cơ sở lí thuyết hàm ngẫu nhiên và ứng dụng trong khí tượng thủy văn, Nxb khoa học kỹ thuât, Hà Nội. [6] V.S. Pygatrep (1980), Lí thuyết hàm ngẫu nhiên và ứng dụng, Nxb Đại học và THCN, Hà Nội. [7] Đào Hữu Hồ (1998), Xác suất - thống kê, Chương trình giáo trình đại học, Bộ Giáo dục và Đào tạo, Hà Nội. [8] Đinh Văn Gắng (1999), Lí thuyết xác suất và thống kê, Nxb Giáo dục, Hà Nội. [9] Nguyễn Doãn Phước (2009), Sử dụng phương pháp nội suy BSPLINE để đánh giá sai số trong miền tần số của bộ biến đổi tín hiệu DAC, Tạp chí Khoa học & Công nghệ (số 74 – 2009), Đại học Bách khoa Hà Nội. Abstract B-spline random functions and their forecast applications In this paper we introduce the concept of B-spline random function with empirical samples of two-dimensional random variables (X, Y) and prove that this random function better reflects the relationship between X and Y in case the correlation coefficient R( X , Y ) is small, to prove this, we have introduced and proven the theorem (2.4). In the application, we have used the theorem (2.4) to establish a B-spline regression function for forecast. Keywords: B-spline random function, B-spline regression function, correlation coefficient, empirical samples, random variable.