intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Một số dạng phương trình vi phân ngẫu nhiên trong bài toán thời điểm dừng tối ưu

Chia sẻ: Acacia2510 _Acacia2510 | Ngày: | Loại File: PDF | Số trang:33

36
lượt xem
5
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận án được chia thành 3 chương với bố cục như sau: Kiến thức chuẩn bị, thời điểm dừng tối ưu cho bài toán quảng cáo, thời điểm dừng tối ưu cho bài toán bán tài sản. Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Một số dạng phương trình vi phân ngẫu nhiên trong bài toán thời điểm dừng tối ưu

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Nguyễn Thành Trung MỘT SỐ DẠNG PHƯƠNG TRÌNH VI PHÂN NGẪU NHIÊN TRONG BÀI TOÁN THỜI ĐIỂM DỪNG TỐI ƯU Chuyên ngành: Lý thuyết xác suất và thống kê Toán học Mã số: 62 46 01 06 (DỰ THẢO) TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội – 2019
  2. Công trình được hoàn thành tại: Trường Đại học Khoa học Tự nhiên - ĐHQGHN Người hướng dẫn khoa học: PGS. TS Phan Viết Thư Phản biện: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .............................. Phản biện: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .............................. Phản biện: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .............................. Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp tại . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vào hồi giờ ngày tháng năm 2019 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam - Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội
  3. i MỤC LỤC MỤC LỤC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i MỞ ĐẦU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ 4 1.1 Tích phân ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . 4 1.2 Phương trình vi phân ngẫu nhiên . . . . . . . . . . . . . . . . 5 1.3 Bài toán thời điểm dừng tối ưu . . . . . . . . . . . . . . . . . 6 1.3.1 Khái niệm thời điểm dừng . . . . . . . . . . . . . . . . . . . 6 1.3.2 Bài toán thời điểm dừng tối ưu . . . . . . . . . . . . . . . . 8 1.4 Mạng nơ-ron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.4.1 Tổng quan về mạng nơ-ron . . . . . . . . . . . . . . . . 11 1.4.2 Huấn luyện mạng nơ-ron . . . . . . . . . . . . . . . . . 12 1.4.3 Phương pháp xây dựng mạng nơ-ron MLP . . . . . 12 1.5 Kết luận chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 12 CHƯƠNG 2. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN QUẢNG CÁO 14 2.1 Mô hình bài toán quảng cáo . . . . . . . . . . . . . . . . . . . 14 2.2 Giải phương trình vi phân ngẫu nhiên . . . . . . . . . . . . . 15 2.3 Xấp xỉ thời điểm dừng tối ưu bằng mạng nơ-ron . . . . . . 17 2.4 Giải thuật giải bài toán thời điểm dừng tối ưu . . . . . . . 17 2.5 Kết quả mô phỏng . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.6 Kết luận chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 19
  4. ii CHƯƠNG 3. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN BÁN TÀI SẢN 21 3.1 Bài toán bán tài sản tối ưu và lời giải . . . . . . . . . . . . . 21 3.2 Xấp xỉ thời điểm dừng tối ưu bằng mạng nơ-ron . . . . . . 23 3.3 Kết quả mô phỏng . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.4 Kết luận chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . 25 KẾT LUẬN 27 CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ 28
  5. 1 MỞ ĐẦU Trong các lĩnh vực mang tính xác suất ngẫu nhiên thì thời điểm dừng tối ưu mang ý nghĩa rất quan trọng. Những người chơi trò chơi Poker thường nói "thắng thua là việc hoàn toàn bình thường, không có gì lạ lẫm cả. Nếu bạn không kiểm soát những rủi ro, bạn sẽ bị những rủi ro kiểm soát". Biết rằng rủi ro là không thể kiểm soát, cũng không thể dự liệu trước, chi bằng ta hãy cố gắng tránh nó, chứ không phải là kiểm soát nó. Việc xác lập được thời điểm dừng tối ưu là việc làm cần thiết để chúng ta tránh được những thất bại nặng nề bởi tình trạng mất kiểm soát khi ưu thế không nằm ở phía mình. Đặc biệt, trong các "trò chơi kinh tế" như chứng khoán, cũng như trong điều hành kinh tế thời điểm dừng tối ưu phải được tính toán cân nhắc thận trọng và ngay cả khi đó cũng nên tiếp tục thực hiện các biện pháp dài hạn để thu về lợi nhuận cao nhất, bền vững và lâu dài. Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình hóa các nguyên lý của những lý thuyết liên quan tới cách thức con người suy nghĩ đã trở thành hiện thực. Nathanial Rochester sau nhiều năm làm việc tại các phòng thí nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để mô phỏng một mạng nơ-ron. Trong thời kì này tính toán truyền thống đã đạt được những thành công rực rỡ trong khi đó những nghiên cứu về nơ-ron còn ở giai đoạn sơ khai. Mặc dù vậy những người ủng hộ triết lý “thinking machines” (các máy biết suy nghĩ) vẫn tiếp tục bảo vệ cho lập trường của mình. Năm 1956 dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial Intelligence) đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng nơ-ron. Tác động tích cực của nó là thúc đẩy hơn nữa sự quan tâm của các nhà khoa học về trí tuệ nhân tạo và quá trình xử lý ở mức đơn giản của mạng nơ-ron trong bộ não con người.
  6. 2 Bài toán thời điểm dừng tối ưu đã được nhiều tác giả xem xét chủ yếu trong lĩnh vực tài chính và được giải thông qua việc giải các phương trình vi phân đạo hàm riêng. Trong luận án này chúng tôi xem xét một cách tiếp cận khác cho bài toán thời điểm dừng tối ưu đó là tiếp cận học máy. Mỗi một quyết định dừng hay tiếp tục tại thời điểm t được biểu diễn bởi một hàm (gọi là hàm quyết định) nhận giá trị trong tập {0, 1}, trong đó giá trị 0 là tiếp tục chiến dịch, giá trị 1 là dừng lại. Chúng tôi tiếp tục xấp xỉ hàm quyết định bởi một mạng nơ-ron nhiều lớp. Sau khi đã huấn luyện mạng nơ-ron, cho dữ liệu qua mạng ta sẽ nhận được quyết định dừng hay tiếp tục. Bố cục của luận án: Ngoài phần mở đầu và phần kết luận, kiến nghị, Luận án được chia thành 3 chương với bố cục như sau: Chương 1. KIẾN THỨC CHUẨN BỊ. Chương này chúng tôi trình bày một cách tóm lược nhất một số kiến thức cơ bản nhất của giải tích ngẫu nhiên bao gồm tích phân ngẫu nhiên, phương trình vi phân ngẫu nhiên, bài toán thời điểm dừng tối ưu. Nội dung ở chương này chủ yếu được trích dẫn từ các tài liệu [0], [0], [0], [0], [0]. Trong chương này cũng giới thiệu các vấn đề cơ bản về mạng nơ-ron, gồm các khái niệm của mạng nơ-ron nhân tạo, lịch sử phát triển, các mô hình mạng và phương pháp xây dựng cũng như huấn luyện mạng. Trong đó đi sâu vào việc xây dựng một mạng nơ-ron truyền thẳng MLP và thuật toán huấn luyện lan truyền ngược. Chương 2. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN QUẢNG CÁO. Trong chương này chúng tôi xem xét một bài toán thực tế đó là xác định thời điểm dừng tối ưu cho một chiến dịch quảng cáo. Thị phần (tiềm năng) của công ty đang xét về một sản phẩm A nào đó được mô tả bằng một phương trình vi phân ngẫu nhiên dưới tác động của chiến dịch quảng cáo thông qua truyền thông cũng như sự truyền miệng của các khách hàng đã có của công ty. Hàm mục tiêu là một hàm liên tục xác định trên thời gian t và thị phần đạt được của
  7. 3 chiến dịch quảng cáo. Trong chương này ngoài việc giải mô hình chúng tôi xem xét một cách tiếp cận khác cho bài toán thời điểm dừng tối ưu đó là tiếp cận học máy. Chương 3. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN BÁN TÀI SẢN. Trong chương này chúng tôi xem xét bài toán bài toán tìm thời điểm dừng tối ưu cho quá trình bán tài sản với tốc độ tăng giá là quá trình Markov rời rạc hai trạng thái (tăng giá và giảm giá). Kết quả tìm được các ngưỡng cố định cho quá trình xác suất hậu nghiệm. Nếu quá trình xác suất hậu nghiệm vượt qua ngưỡng này thì ta quyết định bán tài sản. Các kết quả thu được là khả quan và được kiểm tra trên dữ liệu mô phỏng cho thấy tính đúng đắn của các kết quả tìm được. Cũng như trong chương 2, chương này chúng tôi cũng xem xét một cách tiếp cận khác cho bài toán thời điểm dừng tối ưu đó là tiếp cận học máy. Xấp xỉ hàm quyết định bởi một mạng nơ-ron nhiều lớp, sau khi đã huấn luyện mạng nơ-ron, cho dữ liệu qua mạng ta sẽ nhận được quyết định bán tài sản.
  8. 4 CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ Chương này chúng tôi sẽ trình bày một cách tóm lược nhất một số kiến thức cơ bản nhất của giải tích ngẫu nhiên bao gồm tích phân ngẫu nhiên, phương trình vi phân ngẫu nhiên, bài toán thời điểm dừng tối ưu. Nội dung ở chương này chủ yếu được trích dẫn từ các tài liệu [0], [0], [0], [0], [0]. 1.1. Tích phân ngẫu nhiên 1.1.1. Tích phân ngẫu nhiên Itô 1.1.2. Công thức Itô Định lý 1.1 (Công thức Itô) Cho u(t, x) là một hàm xác định trên [0, T ] × R có các đạo hàm riêng ut , ux , uxx liên tục. Cho Xt là một quá trình Itô với vi phân ngẫu nhiên dXt = f (t, ω)dt + g(t, ω)dWt Khi đó quá trình Yt = u (t, Xt ) cũng là một quá trình Itô với vi phân ngẫu nhiên là 1   dYt = du (t, Xt ) = ut (t, Xt ) + ux (t, Xt ) f (t) + uxx (t, Xt ) g 2 (t) dt 2 +ux (t, Xt ) g(t)dWt Ta cũng có thể viết công thức Itô dưới dạng dễ nhớ hơn như sau 1 dYt = ut (t, Xt ) dt + ux (t, Xt ) dXt + uxx (t, Xt ) (dXt )2 2 trong đó khi tính (dXt )2 ta quy ước (dt)2 = dtdWt = 0, (dWt )2 = dt
  9. 5 Ta có công thức Itô suy rộng sau đây Định lý 1.2 (Công thức Itô mở rộng) Quá trình Yt = u (t, X1 (t), X2 (t), . . . , Xn (t)) là một quá trình Itô với vi phân ngẫu nhiên cho bởi n n n X 1 XX dYt = ut dt + uxi dXi + uxi xj dXi dXj 2 i=1 i=1 i=1 trong đó tích dXi dXj được tính theo quy ước sau (dt)2 = dW dt = dtdW = 0, (dWt )2 = dt Như vậy dXi dXj = gi gj dt và n n n ! n ! X 1 XX X dYt = ut + uxi fi + uxi xj gi gj dt + uxi gi dWt . 2 i=1 i=1 i=1 i=1 1.2. Phương trình vi phân ngẫu nhiên Phương trình vi phân ngẫu nhiên đóng vai trò rất quan trọng trong kĩ thuật, vật lý, kinh tế và một số ngành khoa học khác. Sự ra đời của nó xuất phát từ nhu cầu xác định mối quan hệ giữa một bên là một đại lượng biến thiên liên tục với một bên là độ biến thiên của đại lượng đó. Các mối quan hệ như thế xuất hiện thường xuyên trong các ứng dụng thực tế. Định lý 1.3 Giả sử các hàm b (t, x) và σ (t, x) thỏa mãn các điều kiện sau |b(t, x)| + |σ(t, x)| ≤ C(1 + |x|), x ∈ R, t ∈ [0, T ] với C là hằng số và |b(t, x) − b(t, y)| + |σ(t, x) − σ(t, y)| ≤ D|x − y| với D là hằng số. Gọi Z là đại lượng ngẫu nhiên độc lập với Wt , t > 0 và EZ 2 < ∞.
  10. 6 Khi đó phương trình vi phân ngẫu nhiên dXt = b (t, Xt ) dt + σ (t, Xt ) dWt ; X0 = c (1.1) có nghiệm duy nhất. 1.3. Bài toán thời điểm dừng tối ưu 1.3.1. Khái niệm thời điểm dừng Lý thuyết Martingale bắt nguồn từ trò chơi cờ bạc nay trở thành một loại quá trình ngẫu nhiên có rất nhiều ứng dụng về lý thuyết cũng như thực tiễn, đặc biệt là một công cụ không thể thiếu trong tính toán ngẫu nhiên và toán học trong tài chính. Một công cụ quan trọng trong lý thuyết Martingale và các ứng dụng của chúng là các thời điểm dừng. Thí dụ, chúng ta muốn dừng một Martingale trước khi nó nhận các giá trị quá lớn. Tuy nhiên, dừng nên được thực hiện sao cho đối tượng dừng lại là một Martingale mới thực sự có ý nghĩa quan trọng. Cho không gian xác suất đầy đủ (Ω, F, P ), tức là F chứa tất cả các tập có xác suất 0. (Tập N được gọi là tập có xác suất 0 nếu tồn tại A ∈ F sao cho  N ⊂ A). Một họ Ft , t ∈ R+ các σ - trường con của F được gọi là một lọc nếu  Fs ⊂ Ft nếu s < t. Lọc Ft , t ∈ R+ được gọi là liên tục phải nếu với mọi t ∈ R+ \ F t = F t+ = Fs s>t  Để cho gọn khi nói về lọc (Ft ) ta hiểu là xét lọc Ft , t ∈ R+ . Định nghĩa 1.1 Một hàm T : Ω → [0, ∞) được gọi là một thời điểm Markov đối với lọc (Ft ) nếu nó là F - đo được và với mỗi t ta có {T ≤ t} ∈ Ft (1.2) Nếu P (T < ∞) = 1 (T hữu hạn hầu chắc chắn) thì thời điểm Markov T được gọi
  11. 7 là thời điểm dừng. Nếu lọc (Ft ) liên tục phải thì điều kiện (1.2) tương đương với {T < t} ∈ Ft , ∀t ∈ R+ Ví dụ 1.1 Cho X = (Xt ) là quá trình liên tục và F là một tập đóng trên đường thẳng. Giả sử T là thời điểm lần đầu tiên (Xt ) chạm vào tập F nghĩa là   inf {t : X (ω) ∈ F } nếu tồn tại t như thế t T (ω) = ∞ nếu Xt ∈/ F, ∀t ∈ R+ Khi đó T là thời điểm Markov đối với lọc (Ft ). Thật vậy, đặt G = R\F . Khi đó G là tập mở do đó tồn tại dãy tập đóng (Kn ) sao cho G = ∪n Kn và do X = (Xt ) là quá trình liên tục nên \[ [ {T ≤ t} = {Xs ∈ / Kn } = {Xr ∈ / Kn } ∈ F t . n s
  12. 8 Markov. 1.3.2. Bài toán thời điểm dừng tối ưu Giả sử Xt là nghiệm duy nhất của phương trình vi phân ngẫu nhiên (??) và cho g (hàm giá) là hàm số trên Rn , thỏa mãn a) g(ξ) ≥ 0 với mọi ξ ∈ Rn b) g liên tục. Hãy tìm thời điểm dừng τ ∗ = τ ∗ (x, ω) (được gọi là thời điểm dừng tối ưu) của {Xt } sao cho E x [g(Xτ ∗ )] = sup E x [g(Xτ )] với mọi x ∈ Rn (1.3) τ sup được lấy trên tập tất cả các thời điểm dừng τ của {Xt }. Chúng ta cũng muốn tìm g ∗ (x) = E x [g(Xτ ∗ )] (1.4) Ở đây g(Xτ ) được hiểu là bằng 0 tại ω ∈ Ω mà τ (ω) = ∞ và E x là kỳ vọng với quy luật phân phối xác suất Qx của quá trình Xt ; t ≥ 0 với X0 = x ∈ Rn . Định nghĩa 1.2 Một hàm đo được, nửa liên tục dưới f : Rn → [0, ∞) được gọi là hàm siêu điều hòa nếu f (x) ≥ E x [f (Xτ )] (1.5) với mọi thời điểm dừng τ và với mọi x ∈ Rn . Định nghĩa 1.3 Cho h là hàm thực đo được trên Rn . Nếu f là hàm siêu điều hòa và f ≥ h ta nói f là hàm trội siêu điều hòa của h. Hàm h(x) = inf f (x); x ∈ Rn b (1.6) f
  13. 9 inf được lấy trên tập tất cả các hàm trội siêu điều hòa f của h, được gọi là hàm trội siêu điều hòa tối thiểu của h. Định lý 1.4 (Xây dựng hàm siêu điều hòa tối thiểu) Cho g = g0 là hàm không âm, nửa liên tục dưới trên Rn ta định nghĩa một cách quy nạp như sau gn (x) = sup E x [gn−1 (Xt )] (1.7) t∈Sn trong đó Sn = {k · 2−n ; 0 ≤ k ≤ 4n }, n = 1, 2, . . .. Khi đó gn ↑ b g và b g là hàm siêu điều hòa tối thiểu của g . Định lý 1.5 (Định lý về sự tồn tại thời điểm dừng tối ưu) Cho g ∗ là hàm g là hàm siêu điều hòa tối thiểu của hàm giá liên tục g ≥ 0. giá tối ưu và b a) Khi đó g ∗ (x) = b g (x) (1.8) b) Với  > 0 đặt D = {x; g(x) < b g (x) − } (1.9) Giả sử g bị chặn. Khi đó thời điểm τ lần đầu tiên x rời khỏi tập D gần như là tối ưu, theo nghĩa |g ∗ (x) − E x [g (Xτe )]| ≤ 2 (1.10) với mọi x. c) Đặt D = {x; g(x) < g ∗ (x)} (1.11) Cho N = 1, 2, . . . định nghĩa gN = g ∧ N, DN = {x; gN (x) < b gN (x)} và σN = τDN . Khi đó DN ⊂ DN +1 , DN ⊂ D ∩ g −1 ([0, N )), D = N DN . Nếu σN < ∞ S
  14. 10 h.c.c với mọi N khi đó g ∗ (x) = lim E x [g (XσN )] (1.12) N →∞ d) Đặc biệt, nếu τD < ∞ h.c.c và dãy {g (XσN )}N khả tích, khi đó g ∗ (x) = E x [g (XτD )] và τ ∗ = τD là thời điểm dừng tối ưu. Định lý 1.6 (Định lý về tính duy nhất thời điểm dừng tối ưu) Như trước đã định nghĩa D = {x; g(x) < g ∗ (x)} ⊂ Rn Giả sử tồn tại thời điểm dừng tối ưu τ ∗ = τ ∗ (x, ω). Khi đó τ ∗ ≥ τD với mọi x ∈ D (1.13) và g ∗ (x) = E x [g (XτD )] với mọi x ∈ Rn (1.14) Do đó τD là thời điểm dừng tối ưu. 1.4. Mạng nơ-ron Các nghiên cứu về bộ não con người đã được tiến hành từ hàng nghìn năm nay. Cùng với sự phát triển của khoa học kĩ thuật đặc biệt là những tiến bộ trong ngành điện tử hiện đại, việc con người bắt đầu nghiên cứu các nơ-ron nhân tạo là hoàn toàn tự nhiên. Sự kiện đầu tiên đánh dấu sự ra đời của mạng nơ-ron nhân tạo diễn ra vào năm 1943 khi nhà thần kinh học Warren McCulloch và nhà toán học Walter Pitts viết bài báo mô tả cách thức các nơ-ron hoạt động. Họ cũng đã tiến hành xây dựng một mạng nơ-ron đơn giản bằng các mạch điện. Các nơ-ron của họ được xem như là các thiết bị nhị phân với ngưỡng cố định.
  15. 11 Kết quả của các mô hình này là các hàm logic đơn giản chẳng hạn như “ a OR b” hay “a AND b”. Nội dung của chương này được tham khảo trong [0]. 1.4.1. Tổng quan về mạng nơ-ron Nơ-ron sinh học và nơ-ron nhân tạo a) Nơ-ron sinh học Hình 1.1: Cấu trúc của một nơ-ron sinh học điển hình b) Nơ-ron nhân tạo Một nơ-ron là một đơn vị xử lý thông tin và là thành phần cơ bản của một mạng nơ-ron. Cấu trúc của một nơ-ron được mô tả ở hình dưới. Mô hình mạng nơ-ron
  16. 12 Hình 1.2: Nơ-ron nhân tạo Hình 1.3: Mạng MLP tổng quát 1.4.2. Huấn luyện mạng nơ-ron 1.4.3. Phương pháp xây dựng mạng nơ-ron MLP 1.5. Kết luận chương 1 Chương này chúng tôi đã trình bày một số kiến thức cơ bản nhất của giải tích ngẫu nhiên, trong đó thời điểm dừng tối ưu là khái niệm liên quan trực tiếp tới các chương tiếp theo.
  17. 13 Trong chương này chúng tôi cũng trình bày các vấn đề cơ bản về mạng nơ-ron, gồm các khái niệm của mạng nơ-ron nhân tạo, lịch sử phát triển, các mô hình mạng và phương pháp xây dựng cũng như huấn luyện mạng. Trong đó đi sâu vào việc xây dựng một mạng nơ-ron truyền thẳng MLP và thuật toán huấn luyện lan truyền ngược. Các vấn đề cần nghiên cứu triển khai là: • Tìm hiểu về các thuật toán huấn luyện mạng nơ-ron khác, để có thể đưa ra các so sánh, cũng như chọn mô hình thích hợp cho các bài toán cụ thể. • Phát triển chương trình thực nghiệm có ý nghĩa thực tế như nhận dạng chữ viết tay, nhận dạng ảnh, ...
  18. 14 CHƯƠNG 2. THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN QUẢNG CÁO Trong chương này chúng tôi xem xét một bài toán thực tế đó là xác định thời điểm dừng tối ưu cho một chiến dịch quảng cáo. Thị phần (tiềm năng) của công ty đang xét về một sản phẩm A nào đó được mô tả bằng một phương trình vi phân ngẫu nhiên dưới tác động của chiến dịch quảng cáo thông qua truyền thông cũng như sự truyền miệng của các khách hàng đã có của công ty. Hàm mục tiêu là một hàm liên tục xác định trên thời gian t và thị phần đạt được của chiến dịch quảng cáo. Bài toán thời điểm dừng tối ưu đã được nhiều tác giả xem xét chủ yếu trong lĩnh vực tài chính và được giải thông qua việc giải các phương trình vi phân đạo hàm riêng. Trong chương này chúng tôi xem xét một cách tiếp cận khác cho bài toán thời điểm dừng tối ưu đó là tiếp cận học máy. Mỗi một quyết định dừng hay tiếp tục chiến dịch quảng cáo tại thời điểm t được biểu diễn bởi một hàm (gọi là hàm quyết định) nhận giá trị trong tập {0, 1}, trong đó giá trị 0 là tiếp tục chiến dịch, giá trị 1 là dừng lại. Chúng tôi tiếp tục xấp xỉ hàm quyết định bởi một mạng nơ-ron nhiều lớp. Sau khi đã huấn luyện mạng nơ-ron, cho dữ liệu qua mạng ta sẽ nhận được quyết định dừng hay tiếp tục. Một số kiến thức liên quan được tham khảo trong các tài liệu [0], [0], [0], [0]. 2.1. Mô hình bài toán quảng cáo Chiến dịch quảng cáo thông qua truyền thông sẽ thay tác động vào những người chưa phải là khách hàng của công ty, còn sự lan tỏa sẽ do những khách hàng đã có của công ty quyết định - bằng truyền miệng những khách hàng của
  19. 15 công ty sẽ giới thiệu hoặc khuyến cáo những người tiêu dùng chưa phải là khách hàng nên hoặc không nên mua mặt hàng A, vì vậy sự biến động về khách hàng của công ty được xác định bởi: dn(t) = E(N − n(t)) + M n(t)(N − n(t)) (2.1) dt ở đây E đại diện cho hiệu quả của chiến dịch truyền thông và M đại diện cho chất lượng của sản phẩm A. n(t) Đặt X(t) = N ∈ [0, 1], khi đó phương trình (2.1) trở thành dX(t) = E(1 − X(t)) + M N X(t)(1 − X(t)) = E(1 − x(t)) + M N X(t)(1 − X(t)) (2.2) dt Đặt b = M N và phân rã E thành hai thành phần, một thành phần tất định a và một thành phần ngẫu nhiên tỉ lệ với a là σa. Khi đó phương trình (2.1) trở thành dX(t) = [a(1 − X(t)) + bX(t)(1 − X(t))]dt + σa(1 − X(t))dW (t) (2.3) Giả sử X(t) là nghiệm của phương trình vi phân (2.3). Gọi F = (Ft )t∈[0,T ] là bộ lọc sinh bởi X(t). Xét hàm liên tục g : [0, T ] × R → R, g (t, Xt ) là hàm của thời gian t và thị phần Xt . Bài toán đặt ra là cần xác định thời điểm τ ∗ , là nghiệm của bài toán sau f (τ ∗ , Xτ ∗ ) = sup E [g (τ, Xτ )] τ trong đó τ : Ω → [0, T ] là một F - thời điểm dừng. 2.2. Giải phương trình vi phân ngẫu nhiên Xét phương trình vi phân ngẫu nhiên (2.3) dX(t) = [a(1 − X(t)) + bX(t)(1 − X(t))]dt + σa(1 − X(t))dW (t)
  20. 16 Đặt 1 − X(t) = Z(t) ta có −dX(t) = dZ(t) và do đó dZ(t) = −Z(t)[a + b(1 − Z(t))]dt + σaZ(t)dW (t) hay dZ(t) = bZ 2 (t) − (a + b)Z(t) dt − σaZ(t)dW (t)   (2.4) Để giải phương trình (2.4) ta sẽ đi giải phương trình sau dZ(t) = αZ 2 (t) + βZ(t) dt + λZ(t)dW (t)   (2.5) trong đó α, β và λ là các tham số của quá trình ngẫu nhiên X(t). Đặt 1 Y (t) = Z −1 (t) = Z (t) . Theo công thức Itô ([0]) ta có: 1 1 2 dY (t) = − dZ(t) + λ2 Z 2 (t)dt Z 2 (t) 3 2 Z (t) 1  2   λ2 =− αZ (t) + βZ(t) dt + λZ(t)dW (t) + dt Z 2 (t) Z(t) λ2   β λ =− α+ dt − dW (t) + dt Z(t) Z(t) Z(t) λ2 − β   λ = − α dt − dW (t) Z(t) Z(t) Vì vậy quá trình ngẫu nhiên Y (t) thỏa mãn phương trình sau: λ2 − β Y (t) − α dt − λY (t) dW (t)   dY (t) = (2.6) Phương trình cho bởi (2.6) là một phương trình vi phân ngẫu nhiên tuyến tính và có thể giải được. Định lý 2.1 Nghiệm của phương trình (2.4) có dạng:  Z t −1 −1 1 ds Z (t) = φ (t) −b (2.7) Z (0) 0 φ (s)
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2