Научная литература
booksshare.net -> Добавить материал -> Математика -> Афифи А. -> "Статистический анализ: Подход с использованием ЭВМ" -> 28

Статистический анализ: Подход с использованием ЭВМ - Афифи А.

Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. Под редакцией Башарина Г.П. — М.: Мир, 1982. — 488 c.
Скачать (прямая ссылка): stap1982.djvu
Предыдущая << 1 .. 22 23 24 25 26 27 < 28 > 29 30 31 32 33 34 .. 183 >> Следующая

2.1. Анализ дискретных переменных
67
для аппроксимации выборочного распределения х. В силу этой теоремы при я -> со выборочное распределение х стремится к нормальному распределению N (р, р (1 — р)1п). Согласно эмпирическому правилу, последнее приближение можно использовать, если пр (1 — р) > 9.
Используя нормальное приближение, гипотезу Н0: р = р0 можно проверить при помощи статистики
(2.1.4)
• — Ро
[Ро(1-Ро)/"]1/2
Если верна гипотеза #0, то статистика г0 распределена приблизительно как N (О, 1) (см. табл. 2, приложение II). Сведем теперь все данные в следующую таблицу:
Нулевая Альтернативная р-значение
гипотеза гипотеза
Н0: р - Ро
Яг.
> Ро < Ро Ф- Ро
Р = Рг(г > г0) Р = Рг(г < г0) Р= 1Рг(1> |20|)
Если Нх: р > ро. то /'-значение является площадью под функцией плотности распределения N (О, 1) справа от точки г0 (рис. 2.1.1, а); если Ях: р < ро, то Р — площадь слева от точки г0 (рис. 2.1.1, Ь); если же Нг. р Ф Ро» то Р — удвоенная площадь справа от точки |г0| (рис. 2.1.1, с). Мы отвергнем Н0, если Р < а.
Рис. 2.1.1. Критические области Для гипотезы Н0і р = р0 при использовании нормальной аппроксимации биномиального распределения, а — альтернатива Н%: р> ро\ Ь — альтернатива Н^. р < р0; с — альтернатива Н\: р ф р0,
3*
68
Гл. 2. Элементарные статистические выводы
Нормальное распределение можно использовать для приближенного вычисления 100(1 —а) %-ного доверительного интервала для р. Таким образом, получим
Р±г1- (а/2)у р(1 -р)/п, (2.1.5)
гдег1_Л есть (l--|")"я процентиль распределения N (0, 1).
Пример 2.1.1. Предполагалось, что доля больных сколиозом (искривление позвоночника) в популяции W подростков 12— 14 лет заключена между 0.02 и 0.10. Так как это предположение основывается на предыдущих обследованиях, то ожидается, что в результате предстоящего обследования эта доля окажется даже больше 10 %. Для проверки этого предположения в 1971—1974 гг. такое обследование производилось в округе Лос-Анджелес (Brooks et al, (1975)). Пусть р — доля подростков, больных сколиозом. Надо проверить гипотезу Н0: р = 0.1 против гипотезы Нх: р > > 0.1 при уровне значимости а = 0.05. Сначала был выполнен предварительный тест. После проверки первых 10 детей было установлено, что г — 3 детей больны сколиозом, т. е. р = 0.3 и = 0.7. Чтобы определить, является ли отличие р от р = 0.1 значимым, было вычислено значение Р с помощью биномиального распределения. Используя табл. 1 приложения II, получим ю
Р= Yih0(i, 0.1) = 0.0574+ 0.0112'+ 0.0015 + 0.0001 = 0.0702.
Так как Р > а = 0.05, то гипотеза Н0 не отвергается. Однако, эти результаты не убедительны из-за малой величины выборки.
Всего было обследовано 3492 ребенка, и сколиоз был найден у 474, так что р = 0.136. Для проверки Н0 была использована нормальная аппроксимация (2.1.4), которая дает
z (0.136-0.100) = 7 f)Q
0 1Л). 100 (0.900)/3492
Из табл. 2 приложения II следует, что Р < 0.001. Так как Р < а, то гипотеза Н0 отвергается, и доля больных сколиозом должна быть значительно выше. 95 %-ный доверительный интервал для этой доли равен
0.136 ± 1 -96 У0' 13з|э2864) - (0-124, 0.147).
Заметим, что здесь нормальное приближение является хорошей аппроксимацией, так как п велико.
2.1. Анализ дискретных переменных
69
Название переменной Класс , Частота
Аг г2
2.1.2. Анализ наблюдений, принадлежащих одному из к классов
В этом случае популяция № разбивается на к непересекающихся классов, так что каждый индивидуум из № принадлежит одному и только одному классу. Пусть р{ — доля индивидуумов из принадлежащих классу А{, I = 1, к, так что рг+ + ••¦ + Рк — !• Статистические выводы о популяции W сводятся к изучению параметров р1( .... рк.
По выборке объема п программа подсчета частот генерирует таблицу частот, в которой г1 — частота класса Лг. Здесь гг + ... + гк = п. Из этой таблицы в качестве МП-оценки р1 для рг- получаем р1 = П/п, *= 1, ...,
. Для проверки гипотезы Н0: Рг = р[°\ .. заранее известные величины, такие, что
Гк
к.
(2.1.6)
— Рк ,
где р}
(0)
1=1
Ожидаемые равны
= 1, ...Л.
мы используем критерии х • при выполнении гипотезы Н0
е^прГК Статистика критерия %2 имеет вид
«=1
частоты еъ
(2.1.7)
(2.1.8)
и при #о распределена приблизительно по %2 с v = к — 1 степенями свободы. Альтернативная гипотеза Нг состоит в том, что некоторые из равенств pi = р\0) не верны. Р-значением здесь является площадь справа от точки хо под функцией плотности распределения %2 (k — 1) (табл. 3, приложение II). Мы отвергаем Н0, если Р < а.
Замечания 2.1.1. 1. Если k = 2, то применение критерия дает другой способ проверки гипотезы Н0: р = ро против гипотезы Нг: р Ф р0 по сравнению с обсуждавшимся в разд. 2.1.1. В самом деле, легко показать^ что %о в (2.1.8) есть квадрат z0 из (2.1.4).
2. Точность аппроксимации распределением %2 зависит от объема выборки. Критерий становится точным, когда каждое -> оо. Практически достаточно, чтобы все et ^ 5 или даже некоторые е,- ^ 2, а остальные — не менее 5 (Maxwell (1961)).
70
Гл. 2. Элементарные статистические выводы
Предыдущая << 1 .. 22 23 24 25 26 27 < 28 > 29 30 31 32 33 34 .. 183 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed