intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Sự hội tụ của độ ráp ước lượng theo phương pháp phần dư dịch chuyển

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:7

5
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết Sự hội tụ của độ ráp ước lượng theo phương pháp phần dư dịch chuyển chỉ rõ những điều kiện đảm bảo sự hội tụ của độ ráp của hàm mô hình liên kết với dãy thiết kế tới độ ráp của hàm mô hình giới hạn. Từ đó, sự hội tụ hầu chắc chắn của độ ráp ước lượng được theo phương pháp phần dư dịch chuyển tới độ ráp của hàm mô hình lý thuyết được khẳng định.

Chủ đề:
Lưu

Nội dung Text: Sự hội tụ của độ ráp ước lượng theo phương pháp phần dư dịch chuyển

  1. Journal of Science and Transport Technology University of Transport Technology Convergence of Estimated Roughness by the Shift Residual Method Article info Ban Van To1*, Tuan Anh Đo2 Type of article: 1University of Transport Technology, Hanoi 100000, Vietnam 2Military Technical Academy, Hanoi 100000, Vietnam Original research paper Abstract: The roughness of a function to the given design is introduced. The DOI: conditions to ensure the convergence of the roughness of the model functions https://doi.org/10.58845/jstt.utt.2 associated with designs to the roughness of the limit model function are 023.vn.3.2.11-17 indicated. Since then, the paper confirms the almost sure convergence of the roughness estimated by the method of shift residual to the roughness of the * Corresponding author: theoretical model function. The conditions to ensure convergence is quite E-mail address: extensive and easy to meet in real data analysis. Simulation studies show the bantv@utt.edu.vn appropriateness of the theoretical conclusions. The quality of the estimate is satisfactory even when the number of observations is relatively small, the roughness of the original model function is not very large, but the variance of Received: 01/02/2023 the noise needs to be small. As the number of observations increases, the Accepted: 22/05/2023 roughness of the original model may decrease, and the variance of the noise Published: 28/06/2023 may not need to be very small, but the obtained estimate can still be quite satisfactory. Keywords: Roughness, almost sure convergence, two-phase regression model, change-point. JSTT 2023, 3 (2), 11-17 https://jstt.vn/index.php/vn
  2. Tạp chí điện tử Khoa học và Công nghệ Giao thông Trường Đại học Công nghệ GTVT Sự hội tụ của độ ráp ước lượng theo phương Thông tin bài viết pháp phần dư dịch chuyển Dạng bài viết: Tô Văn Ban1*, Đỗ Anh Tuấn2 1Trường Đại học Công nghệ Giao thông Vận tải, Hà Nội 100000, Việt Nam Bài báo nghiên cứu 2Học viện Kỹ thuật Quân sự, Hà Nội 100000, Việt Nam DOI: Tóm tắt: Trong bài báo, độ ráp của hàm số theo thiết kế cho trước được nêu https://doi.org/10.58845/jstt.utt.2 ra. Bài báo chỉ rõ những điều kiện đảm bảo sự hội tụ của độ ráp của hàm mô 023.vn.3.2.11-17 hình liên kết với dãy thiết kế tới độ ráp của hàm mô hình giới hạn. Từ đó, sự hội tụ hầu chắc chắn của độ ráp ước lượng được theo phương pháp phần dư *Tác giả liên hệ: dịch chuyển tới độ ráp của hàm mô hình lý thuyết được khẳng định. Các điều Địa chỉ E-mail: kiện đảm bảo sự hội tụ là khá tổng quát và dễ thỏa mãn trong những phân tích bantv@utt.edu.vn dữ liệu thực. Nghiên cứu mô phỏng chỉ ra sự phù hợp của kết luận lý thuyết đưa ra. Chất lượng của ước lượng là thỏa đảng kể cả khi số quan sát khá nhỏ, Ngày nộp bài: 01/02/2023 độ ráp của hàm mô hình gốc không lớn lắm song phương sai của nhiễu cần Ngày chấp nhận: 22/05/2023 phải bé. Khi số quan sát tăng lên, độ ráp của mô hình gốc có thể giảm đi, và Ngày đăng bài: 28/06/2023 phương sai của nhiều có thể không cần nhỏ lắm nhưng ước lượng thu được vẫn có thể hoàn toàn thỏa đáng. Từ khóa: Độ ráp, hội tụ hầu chắc chắn, mô hình hồi quy hai pha, điểm chuyển. 1. Giới thiệu cứu, tổng sản phẩm quốc nội Hoa Kỳ tuân theo mô Nhiều quá trình chuyển động tuân theo mô hình điểm chuyển bội. Mô hình điểm chuyển được hình tuyến tính hai pha, ở đó các tham số điều áp dụng thành công trong nghiên cứu sự sinh sôi khiển mô hình giữ nguyên giá trị trong pha đầu, tại của loài tảo cát liên quan đến ô nhiễm môi trường, một thời điểm nào đó nó chuyển sang giá trị khác trong nghiên cứu địa chấn, nhờ đó đã phân biệt và giữ nguyên trong pha còn lại. Việc nghiên cứu được tín hiệu địa chấn do động đất và tín hiệu địa mô hình có thay đổi trạng thái như vậy - còn gọi là chấn từ vụ nổ bom nguyên tử. Có thể liệt kê ra mô hình điểm chuyển - đã được phát triển hơn nửa hàng loạt áp dụng của mô hình điểm chuyển trong thế kỷ qua và đạt được những thành tựu rực rỡ, hàng không vũ trụ, biến đổi khí hậu, chế độ thủy được áp dụng rộng rãi trong nhiều lĩnh vực khác văn, lượng mưa, dự báo, tấn công mạng máy tính, nhau. Trong kinh tế, người ta thấy mô hình điểm nghiên cứu thể thao… Việc nghiên cứu mô hình chuyển bội là phù hợp khi nghiên cứu mối quan hệ điểm chuyển là cần thiết và liên tục được phát triển giữa lãi suất (interest rate) đối với thay đổi lãi suất trong những năm gần đây. chiết khấu (discount rate) quy định bởi FED. Sử Xét mô hình dụng mô hình ARCH để nghiên cứu chuỗi thời gian 𝛼 + 𝛼1 𝑥 𝑖 + 𝜀 𝑖 khi 1 ≤ 𝑖 ≤ 𝑘 ∗ 𝑦𝑖 = { 0 (1) trong miền tần số, người ta đã phát hiện ra sự 𝛽0 + 𝛽1 𝑥 𝑖 + 𝜀 𝑖 khi 𝑘 ∗ ≤ 𝑖 ≤ 𝑛, chuyển đổi của chuỗi thời gian chỉ số chứng khoán, trong đó 𝑎 ≤ 𝑥1
  3. JSTT 2023, 3 (2), 11-17 Tô & Đỗ không có chuyển. Ngược lại nếu ít nhất một trong i) Thiết kế 𝑥 𝑖 trải đểu trên đoạn [𝑎, 𝑏] = [0,1], hai đẳng thức này không xảy ra, mô hình được gọi nghĩa là 𝑥 𝑖 = 𝑖/𝑛, 𝑖 = 1, . . . , 𝑛. là có chuyển và k* được gọi là thời điểm chuyển. ii) Hàm mô hình có thể viết dưới dạng Đối với mô hình có chuyển, 𝛼1 ≠ 𝛽1 , và hai đường 𝑓 𝑛 (𝑥) = 𝛼0 + 𝛼1 𝑥 + ℎ(𝑥 − 𝑥 𝑘 ∗ )𝐼(𝑥 > 𝑥 𝑘 ∗ ), ℎ ≠ 0 (4) thẳng 𝑦 = 𝛼0 + 𝛼1 𝑥 và 𝑦 = 𝛽0 + 𝛽1 𝑥 cắt nhau tại iii) Tồn tại 𝜏0 ∈ (0,1/2) sao cho 𝑘0 < 𝑘 ∗ < điểm 𝜏 trên nửa khoảng [𝑥 𝑘∗ , 𝑥 𝑘∗+1 ) thì hàm mô 𝑛 − 𝑘0 , trong đó 𝑘0 = ⌊𝑛𝜏0 ⌋ + 1 và ⌊𝑙⌋ ký hiệu phần hình được gọi là gãy khúc liên tục, mô hình được nguyên của số thực 𝑙. gọi là liên tục. Trái lại, mô hình được gọi là gián iv) 𝑥 𝑘 ∗ → 𝜏 khi 𝑛 → ∞. đoạn. Ở đây, chúng ta chỉ xét trường hợp mô hình liên tục. Đặt ℎ = 𝛽1 − 𝛼1, Mô hình (1) được viết lại v) Các sai số {𝜀 𝑖 } là các biến ngẫu nhiên độc dưới dạng 𝑦 𝑖 = 𝑓(𝑥 𝑖 ) + 𝜀 𝑖 , 𝑖 = 1, … , 𝑛, trong đó lập, có kỳ vọng không, 𝐸(𝜀 2 ) = 𝜎1 > 0 với 𝑖 = 𝑖 2 𝑓(𝑥) = 𝛼0 + 𝛼1 𝑥 + ℎ(𝑥 − 𝜏)𝐼(𝑥 > 𝜏) (2) 1, . . . , 𝑘 ∗ , 𝐸(𝜀 2 ) = 𝜎2 > 0 với 𝑖 = 𝑘 ∗ + 1, . . . , 𝑛, 𝜎1 , 𝜎2 𝑖 2 2 2 là hàm mô hình và 𝐼(. ) là hàm chỉ tiêu. chưa biết. 𝑛 Có nhiều phương pháp để phát hiện sự tồn Đặt ̂𝑛= 𝑘 argmax ∑ 𝑒̃ 2 𝑖𝑘 tại thời điểm chuyển (xem [1], [2], [3],…). Giả sử 𝑘0 ≤ 𝑘 ≤ 𝑛−𝑘0 𝑖=1 chúng ta biết rằng thời điểm chuyển tồn tại, cần ̂𝑛 𝑘 ước lượng (ƯL) nó. Hãy chia quan sát thành hai Khi đó, lim= 𝜏 hầu chắc chắn (h. c. c. ) 𝑛→∞ 𝑛 nhóm. Nhóm thứ nhất chứa k quan sát đầu Hơn nữa, (𝑥 𝑖 , 𝑦 𝑖 ), 𝑖 = 1, . . . , 𝑘 và giả sử ̂0𝑘 , ̂1𝑘 là ƯL bình 𝛼 𝛼 lim 𝛼 𝑖𝑘 𝑛 = 𝛼 𝑖 , ̂ 𝑖 = 1,2, phương cực tiểu cho hệ số chặn và hệ số góc của 𝑛→∞ mô hình tuyến tính đơn tương ứng. Nhóm thứ hai lim 𝛽0𝑘 𝑛 = 𝛼0 − ℎ𝜏, lim 𝛽1𝑘 𝑛 = 𝛼1 + ℎ𝜏 (ℎ. 𝑐. 𝑐) ̂ ̂ 𝑛→∞ 𝑛→∞ chứa 𝑛 − 𝑘 quan sát còn lại (𝑥 𝑖 , 𝑦 𝑖 ), 𝑖 = 𝑘 + 1, . . . , 𝑛 Các giả thiết ở Định lý trên là khá tổng quát và giả sử ̂0𝑘 , ̂1𝑘 là ƯL bình phương cực tiểu cho 𝛽 𝛽 và dễ đáp ứng được trong những điều kiện thực hệ số chặn và hệ số góc tương ứng. Yêu cầu tự tế. Giả thiết (ii) đảm bảo rằng, mô hình là gãy khúc nhiên là điểm chuyển không được quá gần quan liên tục. Theo giả thiết (iii) ta chỉ cần xét thời điểm sát đầu cũng như quan sát cuối, vậy ta cần có 𝑘0 ≤ chuyển từ 𝑘0 đến 𝑛 − 𝑘0. Giả thiết này đảm bảo sự 𝑘 ≤ 𝑛 − 𝑘0 với 𝑘0 đủ lớn. Theo [4], [5], xét phần dư hội tụ của các tham số ƯL được. Theo [4], chọn 𝑘0 dịch chuyển sao cho 𝑘0 = 𝐶0 𝑛 + 𝑂(1), 𝐶0 ∈ (0,0.5). Giả thiết (ii) 𝑦 − (𝛽0 + ̂1 𝑥 𝑖 ) khi 1 ≤ 𝑖 ≤ 𝑘, ̂ 𝛽 có nghĩa rằng 𝑥 𝑘∗ là điểm chuyển của mô hình có 𝑒̃ 𝑖𝑘 = { 𝑖 (3) 𝑦 𝑖 − (𝛼0 + ̂1 𝑥 𝑖 ) khi 𝑘 + 1 ≤ 𝑖 ≤ 𝑛. ̂ 𝛼 n quan sát. Tử (iii) rõ ràng rằng 𝑘0 → ∞ khi và chỉ Lưu ý rằng các phần dư dịch chuyển 𝑒̃ 𝑖𝑘 khi 𝑛 → ∞. Giả thiết (v) rất tổng quát, ở đó các không là phần dư thông thường: Khi tính phần dư 2 2 phương sai ở hai pha 𝜎1 và 𝜎2 nói chung khác cho nhóm quan sát đầu (pha đầu), chúng ta dùng nhau. Kết luận ở Định lý 1 khẳng định điểm chuyển ước lượng tham số của nhóm quan sát sau (pha ước lượng được ̂ 𝑛 /𝑛 sẽ hội tụ hầu chắc chắn, loại 𝑘 sau) và ngược lại. Ưu điểm của các phần dư dịch hội tụ rất mạnh của lý thuyết xác suất, đến điểm chuyển là chúng gần với phần dư thông thường chuyển thực 𝜏. dưới giả thuyết (khi (𝛼0 , 𝛼1 ) = (𝛽0 , 𝛽1 )), nhưng Hàm f(x) càng gồ ghề, càng lệch nhiều so với chúng được phóng đại lên dưới đối thuyết đường thẳng thì khả năng phát hiện ra điểm (𝛼0 , 𝛼1 ) ≠ (𝛽0 , 𝛽1 ). chuyển càng lớn. Khái niệm độ ráp được đưa ra để 2. Sự hội tụ của độ ráp ước lượng đo mức độ gồ ghề của hàm mô hình. Trước hết chúng ta cần đến định lý sau đã Định nghĩa 1. Độ ráp của hàm f(x) dựa vào đưa ra ở [6]. thiết kế {𝑥1 , . . . , 𝑥 𝑛 } được ký hiệu bởi 𝑆 2 (𝑓, {𝑥 𝑖 } 𝑛 ) và Định lý 1. Giả sử xảy ra các giả thiết sau đây: xác định theo công thức (5) 13
  4. JSTT 2023, 3 (2), 11-17 Tô & Đỗ 𝑛 của (6). Người ta cũng đưa ra khái niệm độ ráp dựa 1 2 𝑆 (𝑓, {𝑥 𝑖 } 𝑛 ) = ∑(𝑓(𝑥 𝑖 ) − (𝑎 + ̂ 𝑥 𝑖 )) 2 ̂ 𝑏 vào họ đường cong tổng quát hơn như họ đường 𝑛 bậc hai, bậc ba,… Các tính chất của độ ráp có thể 1 trong đó ̂, ̂ là ƯL bình phương cực tiểu của 𝑎 𝑏 tham khảo ở [7]. hệ số góc và hệ số chặn tương ứng của mô hình Giả sử đối với mô hình (1), chúng ta tìm được hồi quy tuyến tính đơn với tập dữ liệu ước lượng cho thời điểm chuyển là ̂ 𝑛 và ước 𝑘 (𝑥 𝑖 , 𝑓(𝑥 𝑖 )), 𝑖 = 1, . . . , 𝑛. lượng tương ứng cho tham số ở pha đầu và pha Chú ý rằng 𝑆 2 (𝑓, {𝑥 𝑖 } 𝑛 ) là ƯL cho phương sai sau lần lượt là ̂0𝑘 , ̂1𝑘 và ̂0𝑘 , ̂1𝑘 . Hỏi rằng độ 𝛼 ̂ 𝛼 ̂ 𝛽 ̂ 𝛽̂ 𝑛 𝑛 𝑛 𝑛 chung chưa hiệu chỉnh của mô hình tuyến tính ráp của hàm mô hình ƯL được thông thường. Tuy nhiên, các dữ liệu {(𝑥 𝑖 , 𝑓(𝑥 𝑖 ))} ̂0𝑘 𝑛 + ̂1𝑘 𝑛 𝑥, 0 ≤ 𝑥 ≤ ̂ 𝑛 /𝑛, 𝛼 ̂ 𝛼 ̂ 𝑘 không ngẫu nhiên nên ta không nên gọi đây là ̂𝑛 (𝑥) = { 𝑓 (9) ̂0𝑘 + ̂1𝑘 𝑥, ̂ 𝑛 /𝑛 < 𝑥 < 1 𝛽 ̂𝑛 𝛽̂𝑛 𝑘 phương sai chung. Độ ráp là một đặc trưng hình học hay sử dụng trong cơ học, thể hiện mức độ có hội tụ về độ ráp của hàm f(x) xác định bởi không thẳng, gồ ghề của đường cong 𝑦 = 𝑓(𝑥) khi (2) hay không? Nếu điều này được khẳng định thì ̂ với n đủ lớn, độ ráp 𝑆 2 (𝑓 𝑛 , {𝑥 𝑖 } 𝑛 ) sẽ xấp xỉ độ ráp tiến hành quan sát tại các điểm 𝑥 𝑖 . ̂ 𝑆 2 (𝑓, 𝑥), và do đó, nếu 𝑆 2 (𝑓 𝑛 , {𝑥 𝑖 } 𝑛 ) là lớn, ta có thể Khi chuyển sang trường hợp có vô hạn điểm thiết kế, ta coi mỗi hàm phân bố F(x) có giá 𝐽 ⊂ tin tưởng những kết luận thống kê đã đưa ra. Trái ̂ lại, nếu 𝑆 2 (𝑓 𝑛 , {𝑥 𝑖 } 𝑛 ) tương đối nhỏ, các kết luận về [𝑎, 𝑏] chứa ít nhất hai điểm là một thiết kế suy rộng trên J. Độ đo xác suất ứng với hàm phân bố F(x) giá trị của các tham số ̂ 𝑛 , ̂0𝑘 , ̂1𝑘 , ̂0𝑘 , ̂1𝑘 có 𝑘 𝛼 ̂ 𝛼 ̂ 𝛽 ̂ 𝛽̂ 𝑛 𝑛 𝑛 𝑛 ký hiệu là (dF). độ tin tưởng thấp. Định nghĩa 2. Độ ráp của hàm f(x) dựa vào Câu trả lời là khẳng định. Trước hết ta đưa thiết kế F(x) có giá trên J được ký hiệu bởi 𝑆 2 (𝑓, 𝐹) ra định lý sau đây. và xác định theo công thức (6) Định lý 2. Giả sử xảy ra các điều kiện sau đây: 𝑆 2 (𝑓, 𝐹) = min 2 ∫(𝑓(𝑥) − (𝑎 + 𝑏𝑥))2 𝑑𝐹(𝑥) (𝑎,𝑏)∈ℝ 𝐽 1) Dãy thiết kế 𝐹 𝑛 (𝑥) hội tụ yếu đến thiết kế Đặt 𝐹(𝑥): 𝐹 𝑛 ⇒ 𝐹. 𝑧1 (𝑥) = 1, 𝑧2 (𝑥) = 𝑥, 2) 𝑔 𝑛 (𝑥), 𝑔(𝑥) là những hàm đo được, bị < 𝑧, 𝑧 𝑇 > 𝐹 = [< 𝑧 𝑖 , 𝑧 𝑗 > 𝐹 ] chặn đều trên [0,1]: < 𝑧 ,𝑧 > < 𝑧 ,𝑧 > Tồn tại 𝑀 > 0 để |𝑔( 𝑥)|, |𝑔 𝑛 (𝑥)| < 𝑀 ∀𝑥 ∈ = [< 𝑧1 , 𝑧1 > 𝐹 < 𝑧1 , 𝑧2 > 𝐹 ] , 2 1 𝐹 2 2 𝐹 𝐽, ∀𝑛. < 𝑧1 , 𝑓 > 𝐹 3) (𝑑𝐹)(𝐸 𝑔 ) = 0, trong đó (dF) là độ đo xác < 𝑧, 𝑓 > 𝐹 = [ ], (7) < 𝑧2 , 𝑓 > 𝐹 suất ứng với hàm phân bố F(x), 𝐸 𝑔 = {𝑡 ∈ trong đó ⟨𝑘, ℓ⟩ 𝐹 = ∫𝐽 𝑘(𝑥)ℓ(𝑥)𝑑𝐹(𝑥). ̸ 𝐽: ∃{𝑡 𝑛 } ⊂ ℝ, 𝑡 𝑛 → 𝑡, 𝑔 𝑛 (𝑡 𝑛 ) → 𝑔(𝑡)}. Chúng ta chỉ xét những thiết kế mà ma trận Khi đó 𝑆 2 (𝑔 𝑛 , 𝐹 𝑛 ) → 𝑆 2( 𝑔, 𝐹). < 𝑧, 𝑧 𝑇 > 𝐹 khả nghịch. Theo phương pháp bình Chứng minh. Các hàm 𝑧 𝑖 (𝑥) liên tục và bị phương cực tiểu, cực tiểu ở (6) tồn tại và đạt được chặn, 𝐹 𝑛 ⇒ 𝐹, vậy tại 1 (𝑎 ̂ ) 𝑇 = (< 𝑧, 𝑧 𝑇 > 𝐹 )−1 < 𝑧, 𝑓 > 𝐹 (8) ̂, 𝑏 < 𝑧 𝑖 , 𝑧 𝑗 > 𝐹 𝑛 = ∫ 𝑧 𝑖 (𝑥)𝑧 𝑗 (𝑥)𝑑𝐹 𝑛 (𝑥) 0 Mỗi thiết kế rời rạc {𝑥 𝑖 , 𝑖 = 1, . . . , 𝑛} có ít nhất 1 → ∫ 𝑧 𝑖 (𝑥)𝑧 𝑗 (𝑥)𝑑𝐹(𝑥) (𝑖, 𝑗 = 1,2). hai điểm phân biệt là một thiết kế suy rộng 0 𝐹𝑥1 ,...,𝑥 𝑛 (𝑥) là hàm phân bố mẫu của mẫu quan sát Hơn nữa, các ma trận < 𝑧, 𝑧 𝑇 > 𝐹 𝑛 , < 𝑧, 𝑧 𝑇 > 𝐹 𝑥1 , . . . , 𝑥 𝑛 . Dễ thấy rằng (5) là trường hợp đặc biệt khả nghịch, vậy 14
  5. JSTT 2023, 3 (2), 11-17 Tô & Đỗ det(< 𝑧, 𝑧 𝑇 > 𝐹 𝑛 ) → det(< 𝑧, 𝑧 𝑇 > 𝐹 ) ≠ 0. lim 𝑆 2 (𝑔 𝑛 , {𝑥 𝑖 } 𝑛 ) = lim 𝑆 2 (𝑔 𝑛 , 𝐹𝑥1 ,...,𝑥 𝑛 ) = 𝑆 2 ( 𝑔, 𝐹) n→∞ 𝑛→∞ Từ đó mỗi dãy các phần tử của ma trận Định lý 4. Giả sử các giả thiết ở Định lý 1 𝑇 −1 (< 𝑧, 𝑧 > 𝐹 𝑛 ) hội tụ đến phần tử tương ứng của được thỏa mãn. Khi đó ma trận < 𝑧, 𝑧 > 𝐹 . 𝑇 ̂ lim 𝑆 2 (𝑓 𝑛 , {𝑥 𝑖 } 𝑛 ) = 𝑆 2 (𝑓, 𝑈) (ℎ. 𝑐. 𝑐) 𝑛→∞ Rõ ràng các hàm 𝑧 𝑖 (𝑥)𝑔 𝑛 (𝑥), 𝑧 𝑖 (𝑥)𝑔(𝑥) là đo trong đó f(x) xác định theo (2), ̂𝑛 theo (9) và 𝑓 được, bị chặn; 𝐸 𝑧 𝑖×𝑔 ⊂ 𝐸 𝑔 , (𝑑𝐹)(𝐸 𝑧 𝑖×𝑔 ) ≤ U(x) là hàm phân bố đều trên [0,1]. (𝑑𝐹)(𝐸 𝑔 ) = 0 từ điều kiện (3). Theo Định lý 5.5 Chứng minh. Trước hết ta thấy 𝐹𝑥1 ,...,𝑥 𝑛 ⇒ 𝑈. trong [8] thì Các hàm ̂𝑛 (𝑥) và f(x) đo được, bị chặn đều h.c.c., 𝑓 1 < 𝑧 𝑖 , 𝑔 𝑛 > 𝐹 𝑛 = ∫ 𝑧 𝑖 (𝑥) 𝑔 𝑛 ( 𝑥) 𝑑𝐹 𝑛 ( 𝑥) f(x) liên tục. Đặt 𝜏̂ 𝑛 = ̂ 𝑛 /𝑛, Theo Định lý 1, 𝑘 0 lim 𝜏̂ 𝑛 = 𝜏, lim 𝛼 𝑖𝑘 𝑛 = 𝛼 𝑖 , 𝑖 = 1,2, ̂ 1 𝑛→∞ 𝑛→∞ → ∫ 𝑧 𝑖 (𝑥) 𝑔( 𝑥) 𝑑𝐹( 𝑥). 0 lim ̂0𝑘 𝑛 = 𝛼0 − ℎ𝜏 = 𝛽0 , 𝛽 ̂ lim ̂1𝑘 𝑛 = 𝛼1 + ℎ = 𝛽1 𝛽̂ 𝑛→∞ 𝑛→∞ Suy ra −1 (giới hạn h.c.c.). Vì U(x) liên tục trên (0,1), áp (𝑎 𝑛 , ̂ 𝑛 ) 𝑇 = (< 𝑧, 𝑧 𝑇 > 𝐹 𝑛 ) ̂ 𝑏 < 𝑧, 𝑔 𝑛 > 𝐹 𝑛 dụng Hệ quả 3 ta nhận được kết quả cần chứng → (< 𝑧, 𝑧 𝑇 > 𝐹 )−1 < 𝑧, 𝑔 > 𝐹 = (𝑎 ̂ ) 𝑇 . (10) ̂, 𝑏 minh. Từ chỗ 3. Nghiên cứu mô phỏng 1 2 2 𝑆 (𝑔 𝑛 , 𝐹 𝑛 ) = ∫ (𝑔 𝑛 (𝑥) − 0 (𝑎 𝑛 + ̂ 𝑛 𝑥)) 𝑑𝐹 𝑛 (𝑥), ̂ 𝑏 Xét hai hàm mô hình khai triển vế phải thành tổng, sử dụng (10) và 2 𝑥, 0≤ 𝑥≤ lập luận tương tự như trên ta được 𝑓1 (𝑥) = { 3 2 2 2 1 , < 𝑥 ≤ 1, 2 𝑆 (𝑔 𝑛 , 𝐹 𝑛 ) → ∫ (𝑔(𝑥) − 0 (𝑎 + ̂ 𝑥)) 𝑑𝐹(𝑥). ̂ 𝑏 3 3 Lưu ý rằng giới hạn nhận được chính là 2 𝑥, 0≤ 𝑥≤ 𝑓2 (𝑥) = { 3 𝑆 2 (𝑔, 𝐹) = min 2 ∫(𝑓(𝑥) − (𝑎 + 𝑏𝑥))2 𝑑𝐹(𝑥). 2 10 2 (𝑎,𝑏)∈ℝ 𝐽 − 𝑥+ , < 𝑥 ≤ 1. 3 9 3 Hệ quả 3. Giả sử hàm phân bố mẫu 𝐹𝑥1 ,...,𝑥 𝑛 (𝑥) của mẫu {𝑥 𝑖 } 𝑛 hội tụ yếu đến F(x) là thiết kế trên [0,1], hàm F(x) liên tục tại 𝜐 ∈ (0,1). Giả sử các hàm mô hình ℎ(𝑥), ℎ 𝑛 (𝑥) cho bởi 𝑎 + 𝑎1𝑛 𝑥, 0 ≤ 𝑥 ≤ 𝜐 𝑛 , ℎ 𝑛 (𝑥) = { 0𝑛 , 𝑏0𝑛 + 𝑏1𝑛 𝑥, 𝜐 𝑛 < 𝑥 ≤ 1 𝑎 + 𝑎1 𝑥, 0 ≤ 𝑥 ≤ 𝜐, ℎ(𝑥) = { 0 𝑏0 + 𝑏1 𝑥, 𝜐 < 𝑥 ≤ 1. sao cho lim 𝑎 𝑖𝑛 = 𝑎 𝑖 , lim 𝑏 𝑖𝑛 = 𝑏 𝑖 , 𝑖 = 0,1, Hình 1. Đồ thị các hàm mô hình 𝑓1 và 𝑓2 𝑛→∞ 𝑛→∞ 1 lim 𝜐 𝑛 = 𝜐. Trước hết cần tính 𝑆 2 (𝑓𝑖 , 𝑈) = min ∫ (𝑓𝑖 (𝑥) − 0 𝑛→∞ 𝑎,𝑏 Khi đó lim 𝑆 2 (ℎ 𝑛 , {𝑥 𝑖 } 𝑛 ) = 𝑆 2 (ℎ, 𝐹). (𝑎 + 𝑏𝑥))2 𝑑𝑥. Sử dụng kết quả ở [9, tr 65]: 𝑛→∞ 𝑆 2 (𝑓𝑖 , 𝑈) Chứng minh. Rõ ràng các hàm ℎ 𝑛 (𝑥), ℎ(𝑥) là 1 1 1 các hàm đo được, bị chặn đều trên [0,1], ∫ 𝑑𝑥 ∫ 𝑥𝑑𝑥 ∫ 𝑓𝑖 (𝑥)𝑑𝑥 0 0 0 lim ℎ 𝑛 (𝑥) = ℎ(𝑥), ∀𝑥 ≠ 𝜐, 𝑥 ∈ [0,1], vậy 𝐸ℎ ⊂ {𝜐}. 1 1 1 𝑛→∞ = 𝑑𝑒𝑡 ∫ 𝑥𝑑𝑥 ∫ 𝑥 2 𝑑𝑥 ∫ 𝑥𝑓𝑖 (𝑥)𝑑𝑥 Theo giả thiết, điểm gián đoạn duy nhất có thể của 0 0 0 1 1 1 h(x) là 𝜈, từ đó (𝑑𝐹)(𝐸ℎ ) ≤ (𝑑𝐹){𝜈} = 0. Áp dụng ∫ 𝑓𝑖 (𝑥)𝑑𝑥 ∫ 𝑥𝑓𝑖 (𝑥)𝑑𝑥 ∫ 𝑓𝑖2 (𝑥)𝑑𝑥 Định lý 2 ta được ( 0 0 0 ) 15
  6. JSTT 2023, 3 (2), 11-17 Tô & Đỗ 1 1 + Lập các phần dư dịch chuyển 𝑒̂ 𝑖𝑘 , 𝑖 = 1, … , 𝑛: −1 ∫ 𝑑𝑥 0 ∫ 𝑥𝑑𝑥 0 × 𝑑𝑒𝑡 ( 1 1 ), 𝑖 ∫ 𝑥𝑑𝑥 ∫ 𝑥 2 𝑑𝑥 𝑦 𝑖 − (𝛽0𝑘 + ̂1𝑘 ) với 1 ≤ 𝑖 ≤ 𝑘 ̂ 𝛽 0 0 𝑒̃ 𝑖𝑘 = { 𝑛 chúng ta nhận được 𝑆(𝑓1 , 𝑈) = 0.060767, 𝑖 𝑦 𝑖 − (𝛼0𝑘 + ̂1𝑘 ) với 𝑘 + 1 ≤ 𝑖 ≤ 𝑛. ̂ 𝛼 𝑆(𝑓2 , 𝑈) = 0.101279. 𝑛 Quá trình mô phỏng bao gồm 𝑁 = 2000 lần + Tính sai số bình phương trung bình của các lặp, mỗi lần lặp độc lập gồm một số bước. phần dư dịch chuyển: 𝑛 Bước 1: Sinh quan sát mô phỏng. Ở mỗi 1 bước lặp độc lập, đối với kích thước mẫu 𝑛 và với 𝑠2 𝑛𝑘 = ∑ 𝑒̂ 2 . 𝑖𝑘 𝑛−2 𝑖=1 𝑘 ∗ = ⌊2𝑛/3⌋, sinh 𝑘 ∗ biến ngẫu nhiên độc lập 2 + Tìm 𝑘 để sai số bình phương trung bình các 𝜀1 , … , 𝜀 𝑘 ∗ từ phân bố chuẩn 𝑁(0, 𝜎1 ), và 𝑛 − 𝑘 ∗ biến phần dư dịch chuyển lớn nhất: ngẫu nhiên độc lập 𝜀 𝑘 ∗ +1 , … , 𝜀 𝑛 từ phân bố chuẩn 2 𝑁(0, 𝜎2 ). ̂ 𝑛 = arg max 𝑠 2 . 𝑘 𝑛𝑘 𝑘∈𝐾 Đối với mỗi hàm mô hình 𝑓(𝑥) = 𝑓𝑖 (𝑥), lập Bước 3. Tìm độ nháp của hàm mô hình ước mẫu mô phỏng (𝑥 𝑖 , 𝑦 𝑖 ) với lượng 𝑖 𝑖 𝑥 𝑖 = , 𝑦 𝑖 = 𝑓 ( ) + 𝜀 𝑖, 𝑖 = 1, … , 𝑛. + Lập hàm mô hình ƯL 𝑛 𝑛 Bước 2: Tìm ƯL của điểm chuyển ̂0𝑘 𝑛 + ̂1𝑘 𝑛 𝑥, 𝛼 ̂ 𝛼 ̂ 0 ≤ 𝑥 ≤ ̂ 𝑛 /𝑛 𝑘 𝑓 𝑛 (𝑥) = { 𝑛 𝑛 5𝑛 ̂0𝑘 + ̂1𝑘 𝑥, 𝛽 ̂𝑛 𝛽̂𝑛 ̂ 𝑛 /𝑛 < 𝑥 ≤ 1. 𝑘 + Với mỗi 𝑘 ∈ {⌊ ⌋ , ⌊ ⌋ + 1, … , ⌊ ⌋} = 𝐾, gọi: 6 6 6 + Lập các dự báo của hàm mô hình ƯL: ̂0𝑘 , ̂1𝑘 là ƯL bình phương cực tiểu của hệ 𝛼 𝛼 𝑖 số chặn và hệ số góc của mô hình tuyến tính đơn ̂0𝑘 𝑛 + ̂1𝑘 𝑛 𝛼 ̂ 𝛼 ̂ ̂ với 1 ≤ 𝑖 ≤ ⌊𝑘 𝑛 /𝑛⌋ ̂ 𝑛𝑖 = { 𝑓 𝑛 đối với 𝑘 quan sát đầu tiên (pha đầu): (1/ 𝑖 𝑛, 𝑦1 ), … , (𝑘/𝑛, 𝑦 𝑘 ). ̂0𝑘 + ̂1𝑘 𝛽 ̂𝑛 𝛽̂𝑛 với ̂ ⌊𝑘 𝑛 /𝑛⌋ < 𝑖 ≤ 𝑛. 𝑛 ̂0𝑘 , ̂1𝑘 là ƯL bình phương cực tiểu của hệ 𝛽 𝛽 + Lọc bằng mô hình hồi quy tuyến tính đơn đối số chặn và hệ số góc của mô hình tuyến tính đơn với dữ liệu ((𝑖/𝑛), ̂ 𝑛𝑖 , ), 𝑖 = 1, … , 𝑛, tìm sai số 𝑓 đối với 𝑛 − 𝑘 quan sát cuối cùng (pha sau): chuẩn (Standard error) 𝑆𝐸 𝑛 = 𝑘+1 𝑛 𝑛 ( , 𝑦 𝑘+1 ) , … , ( , 𝑦 𝑛 ). √(1/(𝑛 − 2)) ∑ 𝑖=1 𝜀 2 . 𝑖 𝑛 𝑛 Bảng 1. Giá trị trung bình ̅̅̅̅ 𝑛 và độ lệch chuẩn 𝑠 𝑆𝐸 𝑛 𝑆𝐸 của độ ráp của hàm mô hình ước lượng theo mô phỏng 𝑓 = 𝑓1 𝑓 = 𝑓2 𝑆𝑖𝑔𝑚𝑎 𝑛 𝑆(𝑓, 𝑈) ̅̅̅̅ 𝑛 𝑆𝐸 𝑠 𝑆𝐸 𝑛 𝑆(𝑓, 𝑈) ̅̅̅̅ 𝑛 𝑆𝐸 𝑠 𝑆𝐸 𝑛 20 0.060767 0.349127 0.139681 0.101279 0.355916 0.144979 (1, 0.5) 50 0.060767 0.232269 0.089166 0.101279 0.238314 0.087734 100 0.060767 0.170687 0.061752 0.101279 0.177822 0.063905 20 0.060767 0.144138 0.059700 0.101279 0.099449 0.036686 (0.4, 0.2) 50 0.060767 0.100117 0.036995 0.101279 0.087827 0.026550 100 0.060767 0.075539 0.025693 0.101279 0.086222 0.022090 20 0.060767 0.080605 0.032294 0.101279 0.154684 0.062447 (0.2, 0.1) 50 0.060767 0.060830 0.020777 0.101279 0.111987 0.039481 100 0.060767 0.054021 0.016421 0.101279 0.094985 0.030688 16
  7. JSTT 2023, 3 (2), 11-17 Tô & Đỗ Tổng hợp kết quả. Tính trung bình mẫu ̅̅̅̅ 𝑛 𝑆𝐸 ráp lớn, ta có cơ sở để tin tưởng các kết luận đưa và độ lệch chuẩn mẫu 𝑠 𝑆𝐸 𝑛 của 2000 giá trị 𝑆𝐸 𝑛 ra; nếu độ ráp nhỏ, các kết luận thu được có độ tin nhận được. Đưa kết quả tổng hợp vào Bảng 1. tưởng thấp. Nghiên cứu mô phỏng chỉ ra sự phù Bảng 1 chỉ ra giá trị trung bình ̅̅̅̅ 𝑛 (cột 4, 7) 𝑆𝐸 hợp của các kết luận đưa ra. và độ lệch chuẩn mẫu 𝑠 𝑆𝐸 𝑛 (cột 5, 8) tính toán dựa Tài liệu tham khảo trên các hàm mô hình 𝑓1 và 𝑓2 trong các trường [1] Chen C. W. S., Chan J. S. K., Gerlach R., Hsieh hợp 𝑛 = 20, 50, 100 và khi (𝜎1 , 𝜎2 ) = (1, 0.5), W. Y. L., A comparison of estimators for (0.4, 0.2), (0.2, 0.1). Để tiện theo dõi, cột 3 và cột 6 regression models with change points, Stat. được đưa thêm để chỉ căn bậc hai của độ ráp của Comput., 21, pp. 395-414 (2011). mô hình gốc tương ứng. [2] Kirch C., Bootstrapping sequential change-point Chất lượng của ước lượng phụ thuộc vào độ tests, Sequential Anal., 27, pp. 330-349 (2008). lớn của độ chệch |𝑆(𝑓, 𝑈) − ̅̅̅̅ 𝑛 | và 𝑠 𝑆𝐸 𝑛 . Các giá 𝑆𝐸 [3] Nosek K., Schwarz information criterion based trị này càng nhỏ, chất lượng ƯL càng cao; trái lại, testsfor a changepoint in regression models, các giá trị này càng lớn, chất lượng của ƯL càng Stat. Papers, 51, pp. 915-929 (2010). giảm. Các kết quả ở Bảng 1 chỉ ra rằng, những kết [4] Liu Z., Qian L., Changepoint estimation in a quả phát hiện ra ở phân tích lý thuyết nêu trên là segmented linear regression via empirical thỏa đáng. Khi kích thước mẫu n lớn, độ ráp của likelihood, Communications in Statistics- hàm mô hình gốc lớn và phương sai của nhiễu khá Simulation and Computation, 39, pp. 85-100 nhỏ, chúng ta sẽ có những ƯL tốt nhất. Khi số quan (2009). sát còn tương đối nhỏ (𝑛 ≈ 20), và sai số nhiễu [5] Zhao H., Chen H., Wu X., Changepoint analysis không lớn, 𝑀𝑎𝑥(𝜎1 , 𝜎2 ) ≤ 0.2, chúng ta vẫn có ƯL by modified empirical likehood method in two- tốt kể cả hàm mô hình gốc không ráp lắm phase linear regression models, Opend Journal (𝑆(𝑓, 𝑈) ≈ 0.07). Khi sai số nhiễu lớn lên, of Applied Sciences, 3, pp. 1-6 (2013). 𝑀𝑎𝑥(𝜎1 , 𝜎2 ) ≈ 0.4, cần có kích thước mẫu 𝑛 lớn [6] V.B.To, T.Q.Nguyen, Estimating a change-point hơn và (hoặc) độ ráp của hàm mô hình gốc lớn in two-phases regression model based on the hơn. Nói chung, khi kích thước mẫu 𝑛 tăng lên, khi shift of parameter estimates, Theoretical độ lệch tiêu chuẩn 𝜎1 , 𝜎2 giảm đi, và khi độ ráp của Mathematics and Applications, vol.6, no.4, pp. hàm mô hình gốc 𝑆(𝑓, 𝑈) tăng lên thì chất lượng 33-52 (2016). của ƯL sẽ tăng lên. [7] V.B.To, N.T.Nguyen, T.H.Phan, The roughness 4. Kết luận of model function to the basis function, Journal Với một số giả thiết dễ dàng thực hiện trong of Mathematics and System Sciences, 3, pp. những điều kiện của thực tế, độ ráp ước lượng 385-390 (2013). được của hàm mô hình khi dùng phương pháp [8] Billingsley P., Convergence of probability phần dư dịch chuyển hội tụ hầu chắc chắn tới độ measures, John Wiley (1968). ráp của mô hình thực. Từ đó, khi n đủ lớn, độ ráp [9] K.A.Pham. Giải tích số. Nxb Đại học Quốc gia ước lượng được cho ta thông tin hữu ích: Nếu độ Hà Nội (1998). 17
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2