Теория статистических решений и психофизика - Леонов Ю.П.
Скачать (прямая ссылка):
§ 2. Критерий минимального риска
К понятию оптимальности можно прийти, если учесть стоимость различных решений. Эта стоимость, разумеется, должна быть известна наблюдателю из каких-либо предварительных наблюдений или общих соображений. Она относится к внешним данным задачи и не может быть получена при ее решении.
В случае простой альтернативы имеется четыре возможности, в соответствии с которыми можно ввести плату за различные ре^ шения:
?u — Цена за решение Й1У когда имеет место hx, т. е. цена за правильное решение о состоянии hx\ с12 — цена за решение Н±, когда имеет место h2, т. е. цена за неправильное решение о состоянии h2, с21 — цена за решение Н2, когда имеет место Л15 т. е. цена за неправильное решение о состоянии hx\ с22 — цена за решение Н2, когда имеет место h2, т. е. цена за правильное решение о состоянии h2.
Можно ввести средние условные потери
ri = си (1 — «) + c2ia при hv (3.2a)
r1 — средние условные потери (средний условный риск) за все решения при условии, что Н1 истинна. Первый член дает среднюю плату за правильное решение о hlt второй член дает среднюю плату за неправильное решение о hx. Нетрудно заметить, что (3.2а) есть условное математическое ожидание случайной величины со значениями сп, с12, которые проявляются с условными вероятностями 1 — а и а соответственно. Аналогично определяется средние условные потери (риск) г2 за решения, при которых гипотеза Н2 истинна:
r2 = ciгР + сг2 (1 — Р) при h2. (3.26)
Теперь можно вычислить средний риск, если известны априорные вероятности qx и q2 состояний hx и h2:
R = + <W'2. (3.3)
На основании (3.2а) и (3.26) выражение (3.3) можно записать так:
Ft = <7jCu -f- q2c22 -f- (c21 Cjj) cc -f- q2 (c12 c22) p. (3.4)
Следует заметить, что величина среднего риска (3.3) может быть оценена только по результатам большого числа опытов. В каждом отдельном опыте величина риска является случайной и может сильно отличаться от R.
Обозначим:
С21 С И = ^ О, С12 С22 = C(j 0. (3.5)
Эти величины можно считать положительными, так как стоимость ошибки должна быть больше стоимости правильного решения. На основании (3.5) выражение (3.3) принимает вид
R = ?1С11 + 92^22 + + Мз-Р-' (3-6)
Теперь можно сформулировать критерий бейесовой оптимальной стратегии. Он требует, чтобы средний риск R был минимален. Рассмотрим, к какому оптимальному правилу приведет критерий (3.6).
Необходимые выкладки содержатся в Приложении II.
Как показано в Приложении II, для того чтобы средний риск был минимален, необходимо, чтобы решения принимались в
Соответствий Со Следующим решающим правилом:
если к (х) < Х„, принимаются hx, (3.7)
если к (х) > Я0, принимаются h2.
Порог определяется формулой
<3-8>
и отношение правдоподобия к (х) определяется выражением
*<*>=-/Шг- <3'9)
Стратегия (3.7), где порог выбирается из (3.8), известна как бейесовское оптимальное правило.
Таким образом, это оптимальное правило совпадает с ранее введенным решающим правилом: оно также состоит в сравнении отношения правдоподобия к (х) с порогом Я0.
Бейесовское правило имеет простой смысл. Используя (3.7) и (3.8), можно записать неравенство
QiCj (x/hj) > q2c;J (x/h2), (3.10)
которое имеет место, когда делается решение в пользу гипотезы Нх. Но условные плотности вероятности / (х/кг) и / (x/h2) можно представить в виде (см. Приложение I)
qj (x/ht) = f (hjx)f (ж), q2f (x/h2) = / (h2/x)f (x),
где / Qijx), f (h2/x) — апостериорные вероятности гипотез Ьл и h2 при условии, что сделано наблюдение х; / (х) — плотность вероятности наблюдаемой величины.
Учитывая эти выражения и (3.5), можно записать неравенство (3.10) в виде
(с21 — cu)f (hjx) > (cn—c22)f (h2/x) или
c22f (h3/x) + c21f (hjx) > cnf (hjx) + c12f (h2/x).
Но в последнем неравенстве справа и слева записаны условные риски
с (IIJx) = Сц/ (hjx) + с12/ (h2/x)
и
с (Н2/х) = c2J (h2/x) -(- с21/ (hjx)
гипотез Нх и Н2 при условии, что сделано наблюдение х.
Таким образом, бейесовская оптимальная стратегия предписывает выбирать ту гипотезу, для которой средний условный риск при данном наблюдении оказывается наименьшим (не следует путать средние условные риски с (HJx) и с (HJx) при данном наблюдении х со средними рисками i\ (3.1) и г2 (3.2) при условии выбора гипотез hx и h2).
Пример 3.2
Рассмотрим классификацию предметов на два класса — и h2 — по признакам х и у, являющимся непрерывными величинами х. Будем считать известными условные вероятности признаков
/ (х, y/hj) и / (х, ylh2)
в классах ht и h2. Тогда в качестве признака классификации можно выбрать функцию правдоподобия
flx.y/hj ¦