Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 116

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 110 111 112 113 114 115 < 116 > 117 118 119 120 121 122 .. 183 >> Следующая

В большинстве случаев применения методов обнаружения наблюдений с выбросами параметры щ и '25 неизвестны и поэтому использование статистики %2 вида (5.1.1) не обосновано. Имеется другая процедура проверки, которая использует статистику, являющуюся выборочным аналогом выражения (5.1.1). Пусть х1( ...
\к—случайная выборка, имеющая распределение N (ц, 25). Тогда выборочное среднее и ковариационная матрица имеют соответственно вид
к
*=-тЕх" (51-2)
1=1
к
8=1ГтЕ(х'-*Н*-*)'- (5.1.3)
1=1
Если х — некоторый вектор наблюдений, имеющий распределение N (щ, 25)».то выборочный аналог величины (5.1.1). называемый выборочным расстоянием МпулланпбисаГакется формулой
№ = (х - х)' в"1 (х - х). (5.1.4)
Можно показать, что величина
(5.1.5)
имеет ^-распределение с р и & — р степенями свободы.
Процедура проверки на наличие выбросов среди наблюдений использует статистику, задаваемую выражением (5.1.5), где х и в вычисляются по подмножеству векторов той же выборки, уже проверенных на выбросы. Приведем процедуру, примененную к случайной выборке хь х„ объема п>
316
Гл. 5. Методы многомерного статистического анализа
1. Для каждого вектора наблюдений хг, / = 1, п, вычисляется выборочный вектор средних X; и ковариационная матрица в,- по всем & = п — 1 векторам наблюдений, исключая хг. Согласно выражению (5.1.4), вычисляется выборочное расстояние Махала-нобиса 01 между х1 и х1 с использованием оценки ковариационной матрицы (5.1.3). Затем с помощью формулы (5.1.5) вычисляются
для & = п — 1 и соответствующее Р-значение Рг = = Рг (^ (р, к-р) > ^).
2. Проверка Ръ Р2, Р„. Если все Р1 > а для некоторого взятого заранее значения а, то считается, что в выборке нет выбросов и процесс останавливается. Если некоторые Р{ < а, то вектор наблюдений, соответствующий наименьшему Р-значению, считается выбросом и исключается из выборки. Процедура повторяется для выборки из оставшихся п — 1 наблюдений.
Пример 5.1.2. В табл. 5.1.1. заданы 15 значений систолического (Хх) и диастолического (Х2) давлений, измеренных в мм
Таблица 5.1.1
15 гипотетических значений систолического и диастолического давлений
Обследование 1 2 3 4 5 б 7 8 9 10 11 12 13 14 15
X,- сист. Ъавл. 154 136 91 125 133 125 93 80 132 107 142 115 114 120 141
Хгщ- Ъиаст. давл. 108 90 54 89 93 77 43 50 125 76 96 74 79 71 90
рт. ст. С помощью программы ВАШ ЮМ был проведен анализ этих данных на наличие выбросов среди наблюдений при а = 0.05. Сначала были найдены выборочные средние и стандартные отклонения хг = 120.6, их = 20.9, х2 = 81.0, й2 = 21.7. Согласно описанной выше процедуре, при п = 15 вектор х9 = (132, 125)' был признан аномальным, поскольку для него Р-значение Р9 = 0.0003 было наименьшим из всех Р-значений, меньших а. Затем в выборке, полученной из исходной удалением вектора х9 при п = 14, был выявлен аномальный вектор х7 = (93, 43)', поскольку Р = 0.0264 оказалось наименьшим из всех Р-значений, меньших а. В выборке из оставшихся 13 векторов аномальные наблюдения не были обнаружены. Затем заново были вычислены выборочные средние и стандартные отклонения: хх = 121.8, 5Х = 20.8, х2 = 80.5, б2 = = 16.3. Можно заметить, что в аномальных данных разница между систолическим и диастолическим давлениями необыкновенно мала для х9 и подозрительно велика для х7. Проверка записей показала, что правильными значениями являются х7 = (93, 54)' и х8 = (132, 94)',
5.2. Проверка гипотез о векторах средних
317
5.2. Проверка гипотез о векторах средних
Этот раздел посвящен многомерным аналогам проверок гипотез о средних, приведенных в гл. 2. В разд. 5.2.1 рассматривается проверка гипотезы Я0: fi — ц,0, когда матрица 2 известна. Раздел 5.2.2 посвящен случаю, когда 2 неизвестна. И наконец, в разд. 5.2.3 представлена двухвыборочная проверка гипотезы Н0: ц± = fiit когда 2 неизвестна.
5.2.1. Проверка гипотез о векторах средних
(при известной ковариационной матрице)
Если в одномерном случае случайная величина Y распределена по закону N (р, а2), а а2 считается известной, то для проверки гипотезы Н0: р = р,0 против альтернативы Ях: р Ф р0 используется статистика z = ]/'п (у — РоУ0", где у — выборочное среднее. Гипотеза #о отвергается, если \z\ > zi_(a/2) Для некоторого заранее определенного значения а. В многомерном случае предполагается, что вектор X имеет распределение N (ц, 2). Пусть хь х„ — случайная выборка с таким распределением. Если матрица 2 известна, то для проверки гипотезы о том, что вектор средних равен заданному вектору, т. е. гипотезы Я0: ц = Цо, против Нг: jul Ф Цо, используется статистика
Х2 = п(х-ц0)'2-1(х-^), (5.2.1)
где х — выборочный вектор средних. При гипотезе Н0 статистика (5.2.1) имеет %2_Ропределение с р степенями свободы, так что Р-значение равно площади области, расположенной справа от вычисленного значения х2 поД кривой функции плотности %2 (р). Распределение %2 для статистики (5.2.1) следует из того, что вектор х при гипотезе Н0 подчинен закону распределения N (fio, (l/ri) 2). Заметим, что односторонние проверки теряют смысл в многомерном случае.
Замечание 5.2.1. Вычисление статистики %2 по формуле (5.2.1) может быть легко запрограммировано с помощью процедур перемножения и обращения матриц. Пусть вектор А есть х — ц0, а матрица В = 2 записана по столбцам и IP = р. Тогда с использованием подпрограмм из пакета подпрограмм IBM для научных исследований Scientific Subroutine Package (SSP) вычисление выражения (5.2.1) может быть запрограммировано на Фортране тремя операторами. Например, оператор CALL MINV (В, IP, D, L, М) заменяет матрицу В на В'1. Параметр D принимает значение определителя матрицы В; L и М — рабочие векторы размера IP каждый. Затем оператором CALL GMPRD (Л, В, С, 1, IP, IP) вычисляется матрица С = А В и в результате выполнения
Предыдущая << 1 .. 110 111 112 113 114 115 < 116 > 117 118 119 120 121 122 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed