Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 11

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 5 6 7 8 9 10 < 11 > 12 13 14 15 16 17 .. 97 >> Следующая

выражений как функций от t. При этом будем фиксировать условие x(t) = ?.
Нетрудно убедиться, что с вероятностью I выполняются условия
непрерывности типа третьего равенства (2.1). Кроме того, справедлива
Теорема 2.3. В принятых предположениях функции
(2.9) почти наверное характеризуются локальными параметрами
*(*) = ? =
1 z} (t ft) - г, (t)
limM Л - ----
/г ДО ( ft
| дф.
= тд а, ц+Фяа a, t) аа а, о +.4- а, ц ь,1Э а, о-,
2 охр
Нтм(4- [zi(t + h) - zx{t)] [z".{t h) - z".(t)] (= лю I h J
= Фяа(1, t)<D(2.10)
limM j- [zx{t + h) - zj [Xfi(t + h) - x^(t)]\ g) =
Mo I A J
= Фяа(?, t) t).
Эти соотношения можно доказать, воспользовавшись теорией интегралов Ито
(например, Дынкин [3]), а затем формулой связи (2.8). Как видно из
(2.10), формула вычисления средних приращений М{dzUdt\x\ не является
тривиальной. ,г " 1 ЗФЯа .
Усложняющий член-¦-----оая вызван наличием корреляции
2 дхр р
между процессами xa(t), имеющимися в числе аргументов функции Ф, и
приращениями dxa.
Аналогичным путем можно обосновать следующие несложные, но часто
используемые в дальнейшем леммы.
t
Лемма 2.3. Если v(t)~ [ фа (х (т), т) d* ха (т) и сра, % -
S
34 '
непрерывно дифференцируемые функции, то
U U
j X (х (t), t) d* v (t) =-- j % (x (t), t) фа (x (t), t) d* xa (t),
S S
m. e.
lim tj vit,)) -
Д-0 ^
I
= lim V % t) Фа (*" /,-) [Xa (ti+1) - Xa
\->Q ~
i
Аналогичная лемма справедлива и для интеграла в сим-метризованном смысле.
t
Лемма 2.4. Если v(t) - J фа (х (т), т) dxa (т) и фа, у-функ-
S
ции описанного типа, то
и и
j X (х (t), t) dv (/) = j X (X (t), t) фа (x (t), t) dxl (t).
s s
Пользуясь вместо интегральных равенств дифференциальными, легко видеть,
что согласно указанной лемме 2.3. из dv = <fad*xa вытекает %d*v = %qia.
d*xa и наоборот. Аналогично
dv = <fadxa<^=> %du = %<?adxa (%Ф0).
Таким образом, дифференциальные стохастические равенства можно умножать
на непрерывные функции, и они имеют, следовательно, абсолютный смысл
безотносительно к тому или иному интегральному равенству.
Записывая в дальнейшем какое-либо равенство для дифференциалов, мы всегда
будем его понимать в смысле справедливости некоторого соответствующего
равенства для интегралов.
4. Помимо стохастического интеграла
U
j Фа (X (t), t) d*Xa (t) =
S
H-\
- lim V Фа(х(дД) [*a(fi+1)-*"&)] (2-11)
A^°
можно ввести итовский интеграл, соответствующий обратному времени:
35
j d* xa (t) Фа (*((), t)
N-\
= lim 2 [xa (tt+i) •^а(^)]Фа(-*:(^+1), ti+1), (2.12)
A-*° S5
a также смешанный интеграл
U
"фa(x(t),t)d*Xa(t)Oa(x(t), t) =
N~\
- lim "V Фа(л-(^.)Дг.) [4(^+1)-х"(У1Фа(хЫ. */+i)-
д-*° to
(2-13)
Формула связи интегралов (2.7), (2.12), аналогичная
(2.8), как легко видеть, имеет вид
U
^Ф a(x(t),t)dxa(t) =
S
С 1 Г дФа
= d* xa(t)Oa(x(t), t)---I -- (x(t), t) bafl (x (t), t) dt.
J 2 J <Элг8
S S ^
(2.14)
В то же время для интеграла (2.13) имеем
1 Г Г дфа афа
^ Фа d" Хафа - ^ Фа Фа dxa - ^ ? - Фа Фа J
bafrdt.
р
Из (2.8), (2.14) вытекает формула связи интегралов (2.11) и
(2.12)
р**аФа- \Oad*Xa = jJ^-bapdt. (2.15)
5 S S ^
Таким образом, различные интегралы легко преобразуются один в другой.
Симметризованный интеграл (2.7) занимает в точности промежуточное
положение между (2.11) и
(2.12). Он равен их полусумме.
36
§ 2.2. СТОХАСТИЧЕСКИЕ УРАВНЕНИЯ
1. В некоторых частных случаях процесс {ха (/) }, который мы в^этом
параграфе обозначаем {хаи функцииФ'Дх, t), Фяа (х, /) таковы, что
процессы (2.9) тождественно равны нулю с вероятностью 1: Zi(t) =0, [s,
и], X=l,...,k. В этом случае мы будем говорить, что выполняются
стохастические уравнения
t ^ t ^ ^
j Wx(x(x), x)dx + j Фяа (x (x), x)dxa(x) = О, X = 1, ...,&. (2.16)
S S
Представляет интерес исследовать те связи между процессами Xi (/),
...,xm(t), при которых это имеет место. Обычно оказывается, что часть из
указанных компонентов, скажем xt = Xi, ..., xh= xk(m-k = l>0), однозначно
(с точностью до эквивалентности) определяется остальными компонентами
xh+i = г/i,..., хт^ Ут-h. В этом случае говорят, что функции хх {t),...,
Xk(t) являются решением стохастических уравнений (2.16).
Существующая в настоящее время теория стохастических уравнений основана
на работах Ито [2, 3] и изложена в монографиях Дуба [1] и Дынкина [3]. В
ней изучаются стохастические уравнения более частного вида t i
(t) = j ах (xv ..., xk, x)dx+y^ аЯр (xx xk, x) d*ye(x) (2.17)
S f = l
(X-\,...,k\ yf(t)-винеровские процессы) и рассматриваются достаточные
условия для существования решения хг (/),..., xk(t). По нашему мнению,
эти условия (особенно условие типа |<Тяр (х, t) -аЯр (x',t) | < с \ х-х'
| и т. п.) могут быть существенно ослаблены. Поэтому мы не будем их
перечислять и проверять их выполнение. Однако всегда, когда в тексте
встретится стохастическое уравнение, будет подразумеваться, что выполнены
соответствующие (может быть, более слабые) условия существования их
решения.
2. Уравнение (2.17) может быть получено специализацией уравнения (2.16).
Предыдущая << 1 .. 5 6 7 8 9 10 < 11 > 12 13 14 15 16 17 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed