Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
Подсчет начинают с последовательности
УУ --УУХХ... хх,
(2)
уу...ухух...хх
(3)
последовательностей. Количество инверсий в последней
g = h — Ъ, р = 0,025
1- у у у у у х х х х х
2- уууухухх хх
3. ууухуухххх
4. ууууххуххх
5. уухууухххх
6. ууухухуххх
7. уууухххухх
330 Гл. XII. Порядковые критерии
щего критерия равен 4/252 = 0,016, т. е. он значительно ниже допустимого уровня 0,025.
Это же обстоятельство имеет место и в других примерах. В большинстве случаев существует целый ряд последовательностей с одинаковым числом инверсий. В нашем примере последовательности 5, 6 и 7 имеют по 22 инверсии. Если бы все эти три последовательности были включены в критическую область, то уровень значимости соответствующего критерия превышал бы /3. Однако если ни одну из этих трех последовательностей не включать в критическую область, то критерий окажется излишне слабым.
При больших g и Л вычисление точной границы U'р очень утомительно. Но мы увидим, что в этом случае распределение случайной величины U можно аппроксимировать нормальным распределением.
При двустороннем варианте критерия Вилкоксона нулевая гипотеза отвергается не только тогда, когда количество инверсий превосходит границу Up, но также и тогда, когда эту же границу превосходит количество gh — U обратных инверсий. В этом случае уровень значимости критерия удваивается.
Вместо подсчета инверсий можно xt и ук перенумеровать в порядке возрастания их величины. Если при этом наименьший из всех xt имеет порядковый номер rlt то количество предшествующих нравно тх— 1, и поэтому наименьшему а:соответствуют точно
— 1 инверсий. Если следующий за наименьшим х имеет порядковый номер г2, то ему соответствуют г2 — 2 инверсий и т. д. Таким образом, в итоге получаем
U = (гг — 1) -f [г2 — 2) + . . . + (rg — д) =
= 2rt — \д(9 + 1) (4)
инверсий. Следовательно, для построения критерия Вилкоксона вместо V можно воспользоваться статистикой ^ ri> представляющей собой сумму порядковых номеров случайных величия xt.
Мы постараемся теперь исследовать распределение U несколько точнее. При этом мы сначала будем предполагать, что нулевая гипотеза верна. Напомним, что, согласно этой гипотезе, все xt и ук независимы и имеют одинаковые (непрерывные) функции распределения.
Б. СРЕДНЕЕ ЗНАЧЕНИЕ И ДИСПЕРСИЯ V
Для каждой пары наблюдений х0 ук определим функцию zik, принимающую лишь значения 0 или 1, а именно
„II, если xt> ук, ik — 1
| 0, если х^ук.
§ 63. Критерий Вилкоксона
331
Тогда, очевидно,
U = 2 ztk. (5)
Если нулевая гипотеза верна, то значения 0 и 1 для всех случайных величин zik являются равновероятными. Следовательно, среднее значение zik равно 1/2. Из (5) тотчас же получаем среднее значение для U:
U = \ gh. (6)
Вместо (5) мы можем теперь записать
u-V = 2[*,k-\)' (7)
Для того чтобы вычислить дисперсию о-2 случайной величины U. мы возведем (7) в квадрат и найдем среднее значение:
0-2 = &(U - Uf = 2'6 [zik - I) [zn —I) . (8)
Слагаемые с г ф j и к ф I равны нулю, так как в данном случае
zik и zji независимы и их средние значения равны 1/2. Слагаемые с г = / и k = I все равны 74- Произведения (zik — 1/2) (z;7 — У2) при г = j и кф I равны —1/i, если xt расположен между ук и уг, и равны + У4 — в противном случае. Таким образом, среднее значение такого произведения равно
J_ l_ J_ 2_ __1 4Г ‘З +Т ’З — 12 •
То же самое справедливо и при к = I и i ф j. Окончательно, в силу (8), получаем
^=1 +П 9^ - + Т% Л - 1) --= Т2 (? + Л + 1). (9)
В. АСИМПТОТИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ U ПРИ д-* х И h-ю*
Манн и Уитни1 вычислили не только среднее значение и дисперсию U, но также и нашли для больших д и h асимптотические формулы центральных моментов высших порядков. Моменты нечетного порядка равны нулю, так как распределение U сим-
1 Mann II. В. and Whitney D. II., On a test whether one of
two random variables is stochastically larger than the other, Annals of Math. Stat., 18 (1947), 50.
332
Гл. XII. Порядковые критерии
метрично относительно среднего значения g hf2. Для моментов четного порядка имеет место формула
&(и2') = 1 ¦ 3 • 5 . . . (2г — 1) (gh)' (g + h+iy-~y + В, (10)
где u=U — gh/2 и В стремится к бесконечности (при g -» оо и Л-» оо) медленнее, чем главный член формулы (10). Если и2г разделить на
«г» = (& и2)' = (gh)r (g + h + I)' щ)г ,
затем вычислить математическое ожидание и устремить g и h к бесконечности, то, в силу (10), получим