Научная литература
booksshare.net -> Добавить материал -> Физика -> Николис Дж. -> "Динамика иерархических систем: эволюционное представление" -> 105

Динамика иерархических систем: эволюционное представление - Николис Дж.

Николис Дж. Динамика иерархических систем: эволюционное представление — М.: Мир, 1989. — 490 c.
Скачать (прямая ссылка): dinamikaiearhicheskihsistem1989.pdf
Предыдущая << 1 .. 99 100 101 102 103 104 < 105 > 106 107 108 109 110 111 .. 187 >> Следующая

Р\\=Х 1Х2г Р г\ - У\У2 - 0>
Р\2 = Х1 (1 ' Х2)У Р22 - У\ (1 У2) - 0>
Р\3 == Х2 (1 х\)у ^*23 == ^/2 (1 У) = 0>
Pl4 = (1 A'l) (1 Х2), Р24 == (^ У\) (I - У2) - 11
^31 = 2,22 = 0, Р41 = Ю1(02 = 1,
Р32 == ^"1 0 Z2) = 0> T,42 = COj(l С02) = 0,
^33 = 2!2(1 Zi) ~ 0> ^43 = й:>2(1
^34=0 - Zi)(l - Z2)= I, P44=(l - (c)l)(l - С02) = 0.
Это - апериодическая марковская цепь с асимптотическими значениями и,,
i'g (1, 2, 3, 4), вероятности находиться в состоянии S,, вычисляемыми из
соотношений
4 4
и,- = 2 "/Л-j и 2 ui = 1- (5.2.12)
i=i <=1
Оказывается, что
1 Xi (1 - х2)
4 - -JT, "2- 2
*2 (1 - Xi) " 1 - XiX2
2 . "4 - 2
(5.2.13)
где
2 = 2 + Xj + х2 - Зхгх2. (5.2.14)
Выигрыши двух игроков, соответственно, равны Gi (хь х2) = щ~ и4 + Ъ(и3 -
и2), G2 (хь х2) = Ц, - "4 + i (и2 - ы3).
(5.2.15)
Марковская кинетика развивается во времени не при фиксированных раз и
навсегда "наклонностях", т. е. не при фиксированных вероятностях
перехода. Так как игры итерируются,
Элементы теории игр
281
происходит обучение игроков. Это означает, что эволюция наклонностей во
времени задается системой нелинейных дифференциальных уравнений первого
порядка: производные наклонностей по времени пропорциональны градиенту
математического ожидания выигрыша по данной наклонности. Таким образом,
эволюция во времени основных наклонностей X\(t) и x2(t) определяется
связанными нелинейными дифференциальными уравнениями
dx 1 dG i dx2 dG2
dt dx\ ' dt dx2
(5.2.16)
описывающими траекторию процесса "обучения".
Стационарные значения наклонностей х], х*, определяемые из системы
уравнений
dx] (31 + 1 )-х*22 + 2(1- р'х* - 2?
dt (2 + х] + х\ - 3 х]х]у
dx' (3? + 1)х'2 + 2(1 -?)х}-2?
: о,
(5.2.17)
dt (2 + х] + х\ - Злух^)2
= 0,
равны
: = х: = х = U -1 + У1 + 7&2)/(з| +1);
они существуют только при 1 <; | ^ 3.
Значение х* (см. рис. 5.12) представляет собой порог, выше которого
происходит захват в режим СС; х* - неустойчивое стационарное состояние
(седловая точка). В этом нетрудно убедиться, исследуя условия
устойчивости, которые имеют вид неравенств
+ (5.2.18)
uX j иХ2
дЮ, дЮ2 дЮ, дЮ2 .
а 2 а 2 а а а а ^О./ЛУ/
дх{ дХо дх1дх2 дх\дх2
при х] = X* = X*.
Оказывается, что в данном случае
дЮ{ \ " / дЮ
У
а также
(т.-0'
( d2G\ \ 2 д/l + 7Е" п
^ дх 1 дх2 )х* 22 и>
( дЮ2 \ 2 Vl + 7g2 n
V dxi дх2 )x" 22
282
Глава 5
Обратимся теперь к модификации дилеммы узника (ДУ): рассмотрим ее
обобщение, в котором вероятность ответных мер со стороны "преданного"
партнера равна а, 0 ^ а < 1, т. е.
Рис. 5.12. Описание дилеммы узника в фазовом пространстве (? = 1,5); (х*,
х")-седловая точка, неустойчивое стационарное состояние.
а Ф 1. В этом случае
У1 - zi - У2=
СО] = со2 = 1 >
и для новой цепи Маркова мы получаем вероятности перехода
Рп = х ix2, P2i=a2,
Р!2 = х 1 (I - лг2), Р22 = а(1-а),
Р13 = х2{1-х{), Р23 = а (1 - а),
Р14 = (1 - a:i)(1 - х2), Р24 = (1-")4-
р р _ (5-2.20)
г 31 - и У * 41 - 1 >
Рз2~ а(1 а)> Р42=0,
Рзз = а(\-а), Р43 = 0,
Р34 = (1-а)2, Р44 = 0.
Элементы теории игр 283
Асимптотические значения вероятности попасть в возможные состояния Si
соответственно равны
2 а - 2а2 - 1
Ы'=-ж-
"2:
О
(а - а2 - 1) хх - а (1 - а) х2 + х\х2
, (5.2.21)
- а (1 - а) хх + (а - а2 - 1) л:2 + *1*2
"3 =----------------------------------------------^
а2х, + агх2 + (1 - 2а) Х\Х2 + 2а - 2а' - 1 Ы4" ^
?-0 где
So = (3 - 2а) х,х2 + (а2 - 1) (*, + х2) - 2 (2а2 - 2а + 1). (5.2.22)
[Полагая а - 0, мы получаем прежнее выражение (5.2.13) для ДУ.]
Стационарные значения переменных х\, х2 оказываются равными
- (a2 - l)g - (1 -2а) + д/(а4-8а3 + 18а2- 16а + 7)?2+(2а2-4а + 1)
(3 - 2а) g + 1
(5.2.23)
Это стационарное состояние, как и в предыдущем случае, неустойчиво,
поскольку
т,=т,=°'
/ 02G, Л / d2G2 \ =
V dxi дх2 )х* \ dXidx2 )х*
У(а* - 8a3 + 18a2 - 16a + 7) g2 + (2a2 - 4a +1) > q ^ g ^
В этой задаче
Gi (хь x2) = щ - щ -f I (ы3 - u2), G2 (x\, X2) =Ui - "4 + § (tl2 - U3).
(5.2.15)
В дальнейшем мы будем рассматривать случай а = 1/2; кроме того, мы
модифицируем нормированную матрицу платежей, полагая оба выигрыша в
состоянии S4 равными -2? (рис. 5.13). В результате состояния DC и CD(S2,
S3) станут состояниями локального равновесия, так как состояние Si(DD)
слишком дорого и "не по карману" игрокам [игра для начинающих, или
"желторотых" (ИЖ)]. После несложных преобразований, ана-
284
Глава 5
логичных приведенным выше, получаем новые выражения для G1 и G2:
Gl - ul - 2?"4 I ("з - и2),
02 = их-21щ + 1{и2-иъ). {Ь-2-2Ь)
Система нелинейных дифференциальных уравнений принимает вид:
dx{ 32^2 +4 (4- Н6)*2 + 12^ - 6
dt [4 - 8ххх2 + 3 (хх + х2)]2
dx2 32|Х| + 4 (4 - 11?)+ 12? - 6
dt
(5.2.27)
[4 - 8ххх2 + 3 (ЛС! + *2)]2
Для стационарных значений наклонностей хх, х2 получаем выражения
(-ifg-i)±V(i-|{)
41
26-1
2g
. (5.2.28)
Стационарное состояние опять оказывается неустойчивым или нейтрально
устойчивым. Точнее, состояния (3/8, 3/8) и
/ - 1 / ; 11- V / /
\ -? '(c) 5 Ч \ Q ¦" \
Рис. 5.13, Игра начинающего и соответствующая ей марковская цепь (слева).
Предыдущая << 1 .. 99 100 101 102 103 104 < 105 > 106 107 108 109 110 111 .. 187 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed