Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 37

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 31 32 33 34 35 36 < 37 > 38 39 40 41 42 43 .. 97 >> Следующая

(6.13)
(*?[s, u]).
Тогда эти меры в пространстве (Х,ЛР%) абсолютно непрерывны и производная
Радона-Никодима равна
="<*<•" = "f (j ">¦ '> +
S
и
+ gx{t)ad*ya] - ^ gx[t)agxit)pbae Л|, (6.14)
S
ш- г. %"(х(-)) есть решение уравнения
dtl{ = X' [g*x{t) {У (t), t) dt + gx{t)a (y (t), t) d*ya (t)} = = % (dT*
- dL^)x{i)Mt).
Для доказательства теоремы сначала следует доказать аналогичное
утверждение для пространства (Хп, ^"ПХп),
126
где Xn(ZX- множество функций, имеющих на интервале [s, и], в точности п
скачков. Рассматривая интеграл
где v(A) определяется по формуле (6.12), а также используя непрерывность
функции %" и свойства стохастических интегралов, типа свойств,
формулируемых в лемме 2.3, получим такое же выражение (6.12), но уже для
другого оператора dL*. Следовательно, интеграл (6.15) равен ц(Л | *(s)
=а), что доказывает утверждение для (Хп, ПХп). Чтобы завершить
доказательство, остается составить соединение этих подпространств,
совпадающее с (Х,<ЛР").
В дальнейшем нам понадобится обратная теорема: Теорема 6. 3. Пусть
имеются две марковские меры, абсолютно непрерывные на (XtJV°s), причем
производная имеет вид (6.14). Тогда на [s, и] инфинитезимальные операторы
этих мер связаны соотношением (6.13).
Для доказательства следует рассмотреть инфинитезималь-ный оператор
и соответствующую ему меру ц. Пользуясь прямой теоремой, имеем ц = ц. Но
инфинитезимальный оператор однозначно определяется системой мер (см.
формулу (6.2)), следовательно dL*^ = dL*.
§ 6.2. НЕСКОЛЬКО ДИФФУЗИОННЫХ ПРОЦЕССОВ И МАРКОВСКИЕ ПЕРЕХОДЫ МЕЖДУ НИМИ
1. Пусть имеется ш диффузионных процессов { y(t) ) в /-мерном
пространстве Ri, и каждый из них описывается инфинитезимальным оператором
Здесь с (а, у, t), а9 (а, у, /), ... - функции от у и /, обладающие
свойствами, отмеченными в начале предыдущего параграфа. Они зависят,
кроме того, еще от номера а?Ет = = { 1,..., т}. Каждому номеру
соответствует мера Ра в функциональном пространстве {Y,V ). Элементами
последнего являются функции (/(/) со значениями из Ri. Подобные
функциональные пространства, ст-алгебры в нем и меры рассматривались в §
4.2, § 4.3. Мы будем пользоваться здесь этими результатами.
|x"v(^(.)U(S) = a), А(Л*>1[)Хп, (6.15)
Л
dL* (0%, = dL* (//аз + {gadt + gaad*ya] <5ag
dLa (t) = dL'a (/) = \c (a, y, t) + ap (a, y, i) ~ +
L %
(6.16)
127
Предположим, что наблюдается процесс {y(t)} на интервале [s, и]. Этому
наблюдению соответствует а-алгебра У" (совпадающая с или <MUs в
обозначениях § 4.2). Наблюдатель интересуется вопросом, какой процесс из
т возможных осуществлялся в действительности. В общем случае он не может
ответить на этот вопрос точно, а может лишь указать допустимое множество
HQEm, к которому заведомо принадлежит наблюденный процесс. Это множество
есть множество тех процессов, меры которых на У" взаимно абсолютно
непрерывны с мерой истинного процесса. Это множество непусто с
вероятностью 1, так как истинный процесс заведомо принадлежит ему. Если
допустимое множество содержит лишь один элемент, то статистическая задача
решается полностью: наблюдатель безошибочно (с вероят-
ностью 1) указывает номер истинного процесса. При большем числе элементов
допустимого множества возникает задача, типичная для математической
статистики.
Как видно из вышеизложенного, для данного вопроса фундаментальное
значение имеет рассмотренный в главе 4 вопрос об абсолютной непрерывности
мер диффузионного процесса. Как следует из леммы 2.2 и 4.4, можно
считать, что, помимо процесса {y(t)} на интервале [s, и], наблюдаются
также процессы
<7Ра (0 = bea (а, у (t), t)\ rp. (t) = a9" (а, у (t), t) -
- bt*a- (a, y(t), t) Ь7'п' (а, У (t), t) a^(a, y(t), t) (6.17) (P, <7=1,
...I; P" = /' + l, ...I).
Допустимое множество есть поэтому множество процессов, которые имеют
такие же функции (6.17), что и функции истинного процесса:
Н = {а : bfa (а, у (t), t) = qpo (/); a9- (а, у (/), t) -
¦ ^р'а'^а'я' иЛ' =Гр. (^);
t? [s, и\; Р, сг = 1, р" = V + 1, .. . , /}.
Таким образом, статистическая задача нетривиальна, если имеется по
меньшей мере два процесса, для которых имеет место тождественное
совпадение
bto(a, y(t), t) = bfa(a', y(t), t), ... при t? [s, и].
Теорема 4.1 дает выражение для производной Радона-Никодима мер
допустимого множества.
2. Перейдем к рассмотрению скачкообразных изменений номера
диффузионного процесса. Номер процесса теперь
128
является функцией времени x(t) со значениями из Ет. Пусть л:(-) имеет
конечное число скачков на интервале [s,f|. Наблюдаемый диффузионный
процесс { y(t) } теперь соответствует инфинитезимальному оператору
вместо (6.16). Меру этого процесса в функциональном пространстве (Y,
<2/)удобно обозначить Р(Л | х{-) ),Л? У.
Вместо номера а, независимой переменной теперь является функция х(-). На
этот случай непосредственно переносится все сказанное выше относительно
решения статистической задачи. Допустимое множество Н есть множество НС.Х
функций, которые могут конкурировать с функцией, осуществляющейся
Предыдущая << 1 .. 31 32 33 34 35 36 < 37 > 38 39 40 41 42 43 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed