Курс теории вероятностей - Гнеденко Б.В.
Скачать (прямая ссылка):
П f(Xk\H2)>c п (2)
fc = i fc = 1
Число с определяется из условия
\р(с) = Р{(хьх2.....х„) С Л*2 |Я, } = а,. (3)
До казательство. Так как (в случае независимых испытаний)
вероятность точке (х1( х2....хп) находиться в какой-нибудь области S
равна
П
P{S |#i> = / .. . / П f(xk\Hl)dxldx2...dxn s к = 1 при условии, что верна гипотеза Нх и
П
P{S I #2}=/... / П f(xk \H2)dxxdx2 ... dxn s к = 1
при условии, что верна гипотеза Н2 , то согласно предположению, P{R,n2\H1) =
и для любой другой рассматриваемой нами области Rn2 также
P{^„2 I ^Л)= а1 •
Согласно аксиоме сложения вероятностей
Р{Д„2 -Rn2R'„2 l#i> =Р{Д„2 |Я,> -P{Rn2R*2 |Я,} =
= а, - P{Rn2R'n2 | Я,}
*) Таким образом, Д*2 является наивыгоднейшей критической областью.
§ 64. Проверка статистических гипотез 501
и
— ^п2^п2 I = а1 ” I ) >
т. е.
Р<Л„2 - R'n2R„2 \Н1} = P{R*n2 - Rn2R'n2 | Hi).
Согласно определению R^2 и последнему равенству Р(Кг -RniRn2 I Я2} > сР{/?;2 -RniR'm \НХ) =
= сР{/?„2 -RnlRnliHl)- (4)
Но для любой точки (хь х2,хп), не принадлежащей R^2 ,
« tl П f(xk\H2) < с П f(xk\H1) к = 1 fc = 1
и, следовательно, поскольку область Rn2 - Rn2Rn2 находится целиком вне R„2> ДОЛЖНО быть
cP{Rn2-Rn2R'n2 | HJ > PlR„2-Rn2Rn2 \нг).
Это неравенство вместе с (4) приводит нас к неравенству
Р<Л»2 - RmR'm I Н2}> P{Rn2 - Rn2R*„2 I Н2) .
Прибавив к обеим частям последнего неравенства P{Rn2Rn2\H2},находим, что
Р{Д*2 I Н2) > P{Rn2 I Н2).
А так как
Р(Rn I Н2} = 1 и -Rn2, Rn 1 =Rn -Rn2, TO
РГК*, | н2) < P{Rnl I H2).
ТаккакР{Лп1 \ Н2} и P(/?ni Iпредставляют собой ошибки второго рода для критических областей Rn2 и соответственно Rn2, то теорема доказана.
382
Гл. 11. Элементы статистики
Нам остается подтвердить, что выбор постоянной с действительно можно произвести по правилу (3). С этой целью заметим, что функция
ф(с) = P{R*n2 |Я,}
с ростом с может только убывать (так как неравенству (2) будет удовлетворять все более и более ’’тощее” множество точек (лгь х2,..., х„)), Кроме того, ясно, что ф(0) = 1 (так как для каждой точки (*,, хг,..., хп)
П
п f(xk\H2) > 0.
* = 1
Далее из (2) следует, что
Р{Яп2\Я2) > cP{R*n2\H1) .
Заменив левую часть неравенства единицей и вспомнив определение Ф(с), находим неравенство
1 > сф(с).
Итак,
0 < Ф(с) < 1 /с..
Таким образом, ф(с) -*¦ 0 при с ->«>. Так как функция ф(с) не возрастает, то при любом <*! (0 < < 1) найдется такое с, что
ф (с — 0) > ai > ф (с + 0).
Если в точке с функция ф(с) непрерывна, то выбор постоянной с согласно правилу (3) оправдан; если же в точке с функция ф(с) имеет разрыв, то положение несколько усложняется и требуется незначительно изменить определение множества Rn2 , исключив из него часть точек (Ху, х2,..., х„), для которых
П П
п Г(хк\нг) = с П f{xk\H1), к = 1 к = 1
и присоединив их к множеству R^ , так чтобы вероятность ошибок первого рода была равна ах.
Рассмотрим пример. Пусть известно, что ? распределено нормально с известной дисперсией ст2. Относительно математического ожидания а имеются две гипотезы, состоящие в том, что а = a j (гипотеза Ну) и а = аг (гипотеза Н2). Требуется найти выгоднейшую критическую область.
§ 64. Проверка статистических гипотез
383
В нашем примере соотношение (2) может быть записано в следующем виде:
-zr~i ^ t(хк - аг)2-(хк - аг)2]
2 о к = 1
е с.
Это неравенство, как легко подсчитать, эквивалентно следующему (в предположении, что а2 >аi):
” a2 In с п
2 хк > ----------- + yOi + а2)
к = 1 а2 - а!
или, что то же самое, неравенству
Iй a In с \fn
2 О* _ a,) ^ ------------------+ -— (a2 - a^ -
Полученное неравенство определяет выгоднейшую критическую область R*n2-
Так как величина
1 "
2 О* - aj)
a \fn
к = 1
распределена нормально, с математическим ожиданием 0 и дисперсией 1, если только гипотеза Нх имеет место, то по таблицам нормального распределения и заданному а! легко определить кх (и тем самым с). Пусть для определенности ot\ = 0,05. Тогда кх = 1,645 и, следовательно, наивыгоднейшая критическая область при а! = 0,05 определяется неравенством
П
2 (хк - а^) > 1,645 a\J~n. к = 1
Интересно отметить, что критическая область в нашем примере не зависит от конкурирующего значения а2 .
Область R*nl определяется неравенством
384
Гл. 11. Элементы статистики
которое, очевидно, может быть записано в таком виде: