Теория вероятностей и ее инженерные приложения - Вентцель Е.С.
ISBN 5-06-003830-0
Скачать (прямая ссылка):


Xi приписывается частота р*. Приближенное значение статистического средпего тх найдем как сумму произведений всех Xi и a Pi >
m* = - 3,5.0,012-2,5.0,050- 1,5.0,144 -0,5.0,206 + + 0,5-0,240 + 1,5-0,176 + 2,5• 0,092 + 3,5-02020« 0,168,
Статистический второй начальный момент:
a* [X] = (- 3,5)2-0,012 + (- 2,5)2.0,050 + (-1,5)2-0,144+ + (-0,5)2-0,266 + 0,52-0,240 + 1,52.0,176 + 2,52-0,092 +
+ 3,5а-0,020 «2,126;
вычитая из a* [X] квадрат среднего значения (w*)2,
і 1.5 КРИТЕРИЙ СОГЛАСИЯ Xі
445
11.5. Критерий согласия %2
В настоящем пункте мы коснемся одной из задач третьего типа — проверки правдоподобия гипотез. Предположим, мы хотим установить, противоречат ли опытные данные гипотезе о том, что с. в. X распределена по такому-то закону? Для ответа на такой вопрос пользуются так называемыми критериями согласия, из которых мы остановимся только на одном, чаще всего применяемом, так называемом критерии %г Пирсона.
Изложим идею этого критерия сначала для случая дискретной с. в. X с возможными значениями хи X21 ... ..., xk. Предположим, что произведено п независимых опытов, в каждом из которых с. в. X приняла определенное значение. На основе этих опытов составлен статистический ряд распределения с в. X:
Bll*nl-"l*il — K
\р*I •••IPh
(11.5.1)
где pi «Ні/ті— частота события {X = Xi)9 w<—-число опытов, в которых появилось это событие (j=58I, 2, ...
А:). Мы выдвигаем гипотезу Н, состоящую в том, что с. в. X имеет ряд распределения:
(11.5.2)
а отклонения частот Pi от вероятностей pt объясняются случайными причинами. Чтобы проверить правдоподобность этой гипотезы, надо выбрать какую-то меру расхождения статистического распределения с гипотетическим.
В качестве меры расхождения R между гипотетическим распределением (11.5.2) и статистическим (11.5.1) при пользовании критерием %2 берется сумма квадратов отклонений Pi — р статистических вероятностей Pi от гипотетических Pi, взятых с некоторыми «весами» CiI
R=ItC1(P*- Pi)2. (11.5.3)
i=l
t Коэффициенты Ci вводятся потому, что отклонения, относящиеся к разным значениям р{, нельзя считать равноправными по значимости: одно и то же по абсолютной
446 ГЛ. Ii. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
величине отклонение р* — Pi может быть малозначительным, если сама вероятность рг велика, и очень заметным, если она мала. Поэтому естественно веса с» взять обратно пропорциональными вероятностям ри Но с каким коэффициентом попорциональности?
Пирсон доказал (мы этого делать не будем), что если положить
d = п/ри (11.5.4}
то при большом числе опытов п закон распределения величины R обладает весьма простыми свойствами: он практически не зависит от закона распределепия с. в. X и мало зависит от числа опытов п, а зависит только от числа значений с. в. к и при увеличении п приближается к распределению %2 (п. 9.7). При таком выборе коэффициентов Ci мера расхождения R обычно обозначается %2:
h
x2 = «S Ы — PiY/pi
или, вводя величину п под знак суммы и учитывая, что
Pi = щ/п, где Пі — число значений в ?-м разряде (i =
k
= 1, 2, ..., к); 2 Щ = л, получим i=i
Я = x2 - і ("і - npif/(npi). (11.5.5)
г=1
Распределение х*> как мы знаем, зависит от параметра г, называемого «числом степеней свободы». При пользовании критерием (11.5.5) число степеней свободы полагается равным числу разрядов к минус число независимых условий («связей»), наложенных на частоты Pi. Примерами таких условий могут быть:
2 Pi = 1, (11.5.6)
і = 1
если мы требуем только того, чтобы сумма частот была равна единице (это требование накладывается во всех случаях); или же
k
2 XiP* = тх( (11.5.7)
i=i
если мы требуем, чтобы совпадало статистическое среднее
П.5 КРИТЕРИЙ СОГЛАСИЯ х2
447
с гипотетическим, или же
І {хі-тіУрІ = Ac, (11.5.8)
i = l
если мы требуем, кроме того, еще и совпадения Дисперсий и т. д.
Для распределения %2 составлены таблицы (см. таблицу приложения 3). Пользуясь ими, можно для каждого значения X2 п числа степеней свободы г найти вероятность р того, что величина, распределенная по закону %2, превзойдет это зпачение. В таблице приложения 3 входами являются: значение вероятности р и число степеней свободы г; числа, стоящие в таблице, представляют собой соответствующие значения X2.
Распределение х2 Дает возможность оценить расхождение между гипотетическим распределением (11.5.2) и статистическим (11.5.1). Если вероятность р очень мала (не превосходит выбранного памп зпачения «уровня значимости» а, такого, что событие с вероятностью а считается уже практически невозможным), это значит, что опытпые данные противоречат гипотезе Я, состоящей в том, что св. X имеет распределение (11.5.2): эту гипотезу надо отбросить. Если же вероятность р не мала, можно признать расхождения между теоретическим и гипотетическим распределениями несущественными и отнести их за счет случайных причин. Гипотезу II можно считать правдоподобной, или, по крайней мере, не противоречащей опытным данным.
Подчеркнем, что большое значение вероятности р (папример, близкое к единице) отнюдь не свидетельствует о большом правдоподобии гипотезы Н. Это может говорить, например, о том, что опытпые данные сознательно «подгонялись» под желательное нам распределение (или просто о том, что число опытов п недостаточно велико, чтобы распределение величины R стало близко к X2).



