Научная литература
booksshare.net -> Добавить материал -> Физика -> Стратонович Р.Л. -> "Условные марковские процессы и их применение к теории оптимального управления" -> 66

Условные марковские процессы и их применение к теории оптимального управления - Стратонович Р.Л.

Стратонович Р.Л. Условные марковские процессы и их применение к теории оптимального управления — МГУ, 1966. — 319 c.
Скачать (прямая ссылка): uslovniemarkovskieprocessiiihprimeneniya1966.pdf
Предыдущая << 1 .. 60 61 62 63 64 65 < 66 > 67 68 69 70 71 72 .. 97 >> Следующая

9.1 .А. Элементы матрицы Вар постоянны (не зависят от х);
9.1.Б. Функции Ga (х) = ga -f- GapXp линейно зависят от х;
9.1 .В. Функция F (х) = / -j- Faxa -|-Г FafiXax$ зависит от х
линейно и квадратично.
Тогда, подставляя
wt (х) - ехр |с (t)-----~ ^ ha& (ха - та) (хр - /лр) j (9.26)
а.р
в (9.25), по аналогии с (9.24) получаем уравнения
dF
hafi [щ - Gp (т)\ = (ту,
ила
hafi== 2ЛауВу6^вр hay Gyp hpyGya Fafi' (9.27) Этим уравнениям
соответствуют начальные условия Я1а (*") = hafi (to) == hafi> где та,
hafi - параметры начального гауссовою распределения;
wu (х) = const ехр | Х- Лар (ха - та) (дгр - /Пр) |.
Вводя обратную матрицу
11*03 11 = 11 Aapll-1,
уравнения (9.27) можно преобразовать к виду
д F
та - Ga (т) + ?ар (т) = ga + kapFр + (Gay + ka&FPv) my;
UXfi
(9.28)
hafi = 2Bap -f- GaykyP -f- Gfrykya + kayFY6^fip.
Обычно при выполнении требований 9.1.А-В оказываются зависящими от
наблюдаемого процесса {y(t)} (и притом линейно) лишь функции ga, Fa . В
соответствии с этим уравнения фильтрации (9.28) будут определять линейное
преобразование наблюдаемого сигнала { у (t)} в оценочный сигнал \т (t) }.
Таким образом, в этом случае указанные уравнения определяют линейную
оптимальную фильтрацию, но, вообще говоря, нестационарную.
215
2. Обратимся к примерам § 9.4. Условия 9.1.А-В будут выполнены для
уравнений (9.19), (9.21), если а (х) линейная функция, скажем a (x)=v-
Тогда в (9.22) для (9.19)
B = ~b; G(х) = v - ух\ F = ~ (ху - ~ х2) и уравнения (9.28) принимают вид
т = v - ут + (у1 - т)\
k-\-2yk = b (т = х0).
(9.29)
Обратимся к другому примеру, т. е. к уравнению (9.21). Для него
В = ЙР°2 • Q (х) = 2Pp2v + ь (У + М - Р (Ь + 2уда) х . ft + 2|3а2 ' ^
Ь + 20а2
(Р - Y) (У + $У - v) * -ir (Р - Y)2 *2 F = f+-------------------------- 2
(9.30)
ft + 2 (За2
Поэтому уравнения фильтрации (9.28) дают
т = - P + 2V°2 т I 2P°2v + ь (У + РУ) I
Р + 2ро2 р + 2ра2
fi
+ k 7+2pYo2 • ty + Ру - v - (Р - Y)
: 2ft(3o2 _ " ft + 2уа2 R _ (p - у)2 и*
ft + 2Ра2 ft + 2ра2 ft + 2ра2
Особый интерес представляет стационарный режим фильтрации, когда
параметры процессов не зависят от времени, а момент начала работы
устремляется в далекое прошлое: t-tQ-+oo. Тогда апостериорная дисперсия k
обращается в постоянную, которую можно найти из уравнений фильтрации,
приравнивая нулю производную k. Разрешая получающееся квадратное
уравнение, находим, что для случаев (9.29) и (9.30) стационарная
дисперсия соответственно равна
k = Vy2N* + Nb-yN;
Ь = (Р - Y)~2 [ VФ + 2уа2)2 р2 + 2бра2 (р - у)2 -(Ь + 2уст2) р].
В описанном стационарном приближении данное решение проблемы фильтрации
по результатам совпадает с решением, которое может быть получено при
помощи теории линейной
216
фильтрации Винера. Изложенный путь решения, явно использующий марковские
свойства процессов, требует, однако, меньших вычислений. Еще более
существенны! преимущества данного метода при рассмотрении нестационарного
режима фильтрации. Формулы (9.28) дают решение проблемы также при
конечных временах работы t-10 и при параметрах процессов, меняющихся во
времени.
3. Рассмотрим важный случай многомерного условного марковского
процесса, когда требования 9.1.А-В являются выполняющимися. Именно, пусть
имеется (т + I) -мерный диффузионный процесс {Zj\ и наблюдается I его
компонентов, как это было в гл. 7. Но дополнительно предположим, что
локальные дисперсии bjk не зависят от z, сносы зависят линейно:
+ (z, t) = v;. + djkzk, j = 1 m + l
и c = 0 (можно полагать, конечно, с = с0 + с3- г, + -^ сЛ г,- zh,
но с практической точки зрения это мало интересный случай).
Чтобы записать апостериорный инфинитезимальный оператор и уравнение
(9.25) для данного случая, остается лишь воспользоваться формулами
(7.16), (7.19). При сделанных предположениях ряд членов в этих формулах
выпадает, и мы имеем
2-Bafl - bafi ^aa'^a-p-^p'P>
Ga (x) = aa (x, y, t) + bar/bj>v [y". - aa. (x, y, *)] =
= 'Ч "Ь лУя "Ь bap'bp'o' (Уа' Y<j- ^а'я?/я) "Е
-p (d-afi bap'bp'o'da'g,) Xp, (9.32)
F (x) =---------------- b,yb-}a4<,'j + (v + ЛупУл + dyaXa) b~}a, (ya. -
2~ V° 2~ ^a'p^p 2~
Условия 9.1.A-В оказываются выполненными, апостериорная плотность
распределения является гауссовой и мы без труда можем записать уравнения
(9.28) для ее параметров:
та = Ga (т) + [уа- - а(т, у, t)} b&\- dp^kpa =
= аа (т, у, t) + [уа. - аа¦ (т, у, 0] bp9- [b9-a + de^a];
Ь-а.3 " 2Вар -f- (day Ьщ'Ьр'а' ??а'у) ^уЗ Ч"
Ч" (d$y bfr9'bp'(s'do'y)kya kay dp'ybp'Q' cfa-g&ep. (9.33)
217
Приведенные раньше уравнения (9.30) являются частным случаем этих формул.
Наблюдаемые координаты {у9} и апостериорное распределение вероятностей wt
(х) для остальных координат образуют в совокупности согласно теореме 5.9
вторичный марковский процесс. Поскольку апостериорное распределение wt(x)
определяется параметрами {та}, {&ар} , причем изменение параметров ka^(t)
носит неслучайный характер и может быть вычислено заранее, целесообразно
заменить wt (х) на апостериорные средние {та\. Тогда останутся лишь
Предыдущая << 1 .. 60 61 62 63 64 65 < 66 > 67 68 69 70 71 72 .. 97 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed