Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 5

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 2 3 4 < 5 > 6 7 8 9 10 11 .. 97 >> Следующая

(1.8) приводит к сумме полилинейных выражений от функции G и от ее
производных вида
(после дифференцирования нужно положить t/i= ... = yq = y), где Qqfl...9q
(tj,...,xq)-некоторые ограниченные положительные функции ОТ Tl, .... xq.
не зависящие от у, to или р. Это будет принято во внимание в дальнейшем.
"Близость" процесса x(t) к марковскому будет обеспечиваться малым
параметром р при специальном выборе зависимости G от р. Имея в виду
рассмотреть сходимость процесса к диффузионному, положим
х1 (t) = J* G (у, х, 0), р) dx;
S
х2ю = Yiir f т' ^ Г (G(y'Ti' ^ dXiJdx'
00
(1.8)
X Qqpt...pq (n xq)dx1...dtq (1.
(1.9)
G(x, t, ев, p) = p2m(x) + p?(x, t, to),
(1.10)
т. е.
М g (х, t, со) = 0.
Функции т, g уже не зависят от р.
Вводя новый масштаб времени, положим t-y2t. Если обозначить
Подстановка (1.10) в (1.9) увеличит число членов. Выписывая для примера
типичный член, в который г раз входит g и q-г раз входит т{у), будем
иметь
В том, что они справедливы, и в том, что р входит в (1.13) лишь в
комбинации g!\i, можно убедиться, составляя выражения (1.8), (1.9)
непосредственно во времени t при помощи уравнения (1.12). Оценим длину
гарантированного интервала сходимости, применяя (1.6). Согласно (1.10)
имеем Mg = pMg + О (р2), Mg = sup | g |. Поэтому длина интервала
сходимости на оси t, равная [Mg + 0(p)]_1pmin(a-у, а + у), сокращается
при р->0, в то время как длина на оси t, равная [pMg + 0(p2)]_Imin(a-у, а
+ у), неограниченно увеличивается. В действительности длина фактического
интервала сходимости еще больше. Функция g(x, t, to) как стационарная.
функция времени является знакопеременной величиной, поэтому время
пребывания функции x(t) в / и время пребывания всех ее приближений есть
0(р~2) (или 0(1) в масштабах t). Не проводя строго обоснования этого
факта, мы сформулируем условие сходимости рассматриваемого в дальнейшем
ряда как дополнительное предположение.
то будем иметь
^ =т(х) + -g{x, t, со), х(Т) = /~ (у). (1.12)
dt w Р v '
Мы использовали соотношения
13
§ 1.2. ОСНОВНАЯ ТЕОРЕМА
Зафиксировав начальное условие' хо, рассмотрим процесс
x(t)=fo(xo). Основное утверждение будет заключаться в том, что этот
процесс при ц->0 стремится "по распределению" к диффузионному марковскому
процессу.
Теорема 1.1. Пусть g(x, t, и) есть описанная выше функция. Предположим,
что 1) ее семиинварианты
К [g(xv tlt а), , g(xr, tn со)] == kr (xlt tx.xn tr) s=
- kr (t2 ... t tr /^)
удовлетворяют условиям
~ (* N dv'+-+v>-
lim L \ (L-t) dr \ ... V -kr (r, - ях
ь-"°° •' J J I dx)'1 . . . dxx'r
0 0 0 1 r
йя1 . .. dnr-2 = Nr < oo;
lim L 2 Гxdx f... П dv'+"'+v' k'r(-t L->°° .) J О I дхУ1 ... dxvr
(1.14)
Яг-2)
(1.15)
.. . t Си-1> T, Т "j- Яр . . . , Т -j- Яг-и-])
dt,! ... d^u-idn^ ... йЯг-u-i = 0 (1-16)
при всех г > 2; и > 1, г - и 1; ¦ vx > 0, ... , vr > О,
2) распределение случайных величин (1.23) однозначно определяется своими
моментами и 3) что ряд (1.29) сходится. Т огда
1.1.А. Любое конечномерное распределение процесса x(t), определенного
уравнением (1.12), при ц-*0 вполне сходится к соответствующему
распределению некоторого марковского процесса xM(t);
1.1.Б. Последний является диффузионным: limM =0,
<7> 3 и характеризуется следующими параметрами сноса и локальной
дисперсии
о
Ах" ч , д
lirnM-
д-"о
= Ш (хм) + - J k2 (х', хм, т) dx (х' = хм);
Ах;
lim М----------
д-*о Д
л
-= \ k2(x,
м> х№, т) dx,
(1.17)
14
если Nr = 0 при г > 3. (1.18)
При доказательстве теоремы будет использована
Лемма 1.1. Пусть заданы две группы случайных величин ?а = ?а (со, р), а=
1, ...,р ulft = ?р(со, р), р = р+1,p + s таких, что существуют и конечны
как все моменты
M^v, •••5v"(Yi. ...,Y" = 1 Р + 5; d - 1,2, ...),
так и соответствующие им пределы
lim.MgY, ...EVo. (1.19)
Тогда, если при любых /г> 1, /> 1 парные корреляции исчезают:
limK[U •••&.*, Ер, ...Ер.]=0 (1.20)
ц->0 я 1
(а,. = 1, ... , pr, pf = р + 1, .. . , р -f s),
то указанные группы становятся независимыми, то есть функция
распределения стремится к произведению функций распределения
Р 1^1 Д, ¦ • • ! Ер+s <С Zp+Л F1 (Д. ¦ . ¦ , Zp) F2 (2p+l, . . . ,
2p_|_s)'.
Сходимость "вполне" (в.п.) определена в книге Лоэва [1], стр. 191.
Доказательство леммы 1.1. Примем во внимание известное решение "проблемы
сходимости моментов" (Лоэв [1], стр. 198), которое гарантирует
существование полного предела функции распределения P[|i<2i, ...,
|P+S<2P+S]. Этот предел однозначно (с точностью до постоянного
слагаемого) определяется соответствующей характеристической функцией и
предельными моментами (1.19). Поэтому
р [?l < 21( ... , Ep+S < zp+s] ^ F (zlt ... , Zp+s),
где F(z\, ..., zp+s) обычным образом выражается через характеристическую
функцию 0 (ui, ..., up+s). Для доказательства леммы остается показать,
что эта характеристическая функция, определяемая пределами (1.19),
распадается на произведение:
в(щ, ... , up+s) = вДы^ ..., ир) 02("p+i, .... Wp+s). (1.21)
Из (1.20) вытекает, что стремятся к нулю все смешанные семиинварианты
Предыдущая << 1 .. 2 3 4 < 5 > 6 7 8 9 10 11 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed