Математическая статистика - Варден Б.Л.
Скачать (прямая ссылка):
14 628 12 146
394
Гл. XIII. Корреляция
Отсюда, в силу формулы (34), получается оценка для истинного коэффициента корреляции, а именно
г' = 2 sin Л Л = 0,893.
6
Выборочный коэффициент корреляции г, вычисленный непосредственно по оценкам, равен
г = 0,890.
Пирсон справедливо замечает: «Согласие между г и г' в этом случае является превосходным».
§ 71. Коэффициент ранговой корреляции Т, по Кендаллу
В родственной связи с Л находится коэффициент ранговой корреляции т, который для наших целей предпочтительнее обозначить буквой Т. Этот коэффициент был введен Грейнером и Эсчером и заново открыт Кендаллом. Обстоятельное исследование свойств Т можно найти в уже неоднократно цитированной книге: Kendall М. G.,Rank Correlation Methods. В этом параграфе мы затронем лишь некоторые основные вопросы.
А. ОПРЕДЕЛЕНИЕ Т
Пусть снова имеется п индивидуумов, упорядоченных по двум качественным признакам. Для каждой пары индивидуумов (г, к) мы определим функцию, принимающую значения: +1, если порядковые номера одного индивидуума превосходят соответствующие порядковые номера другого индивидуума, и —1 в противном случае. В обозначениях § 70 Д эта функция для пары индивидуумов (*', к) равна произведению xikyik. Сумма S таких произведений для всех пар,
8 = 2 xikVik< (!)
по абсолютной величине не превосходит
(П] _ п(п — 1)
12 J == 2 '
Следовательно, если положить
т = «?ч‘ (2>
то значения Т будут принадлежать отрезку, расположенному
между —1 и +1. При этом Т = -И тогда и только тогда, когда
обе последовательности порядковых номеров совпадают (разность порядковых номеров каждого индивидуума равна нулю), и Т = —1 тогда и только тогда, когда обе последовательности противо-
§ 71. Коэффициент ранговой корреляции Т, по Кендаллу 395
положны друг другу (сумма порядковых номеров каждого индивидуума равна п -j- 1).
Если номера первой последовательности расположить в возрастающем порядке от 1 до и и под каждым из них написать номер из второй последовательности
fel “ fe2 • • ‘f fen
¦4l > -r)r,t
то S можно будет вычислить следующим образом: подсчитаем количество тех r)k, которые стоят правее и величина которых превосходит затем подсчитаем, сколько имеется номеров щ, больших г)2 и расположенных правее г\г, и т. д. Пусть Р — сумма всех этих количеств, тогда S представляет собой сумму Р величин,
равных +1, и —Р величин, равных —1, т. е.
Я = 2Р —2-и(п—1), (3)
т = аДт)~1- <4>
Б. РАСПРЕДЕЛЕНИЕ Г
Если случайные величины х и у независимы, то математическое ожидание Т, очевидно, равно нулю. Если же ж и у зависимы и распределены нормально с коэффициентом корреляции д, то математическое ожидание S принимает значение
&S = &2 xikyik = —^ & xl2yVij
т. с., согласно (29) § 70,
„ С п(п — 1) 2 6 о = —=—arc sin p.
Z 71
Таким образом,
g Т = arc sin g. (5)
Поэтому если совместное распределение х и у является нормальным, то величину
г" = sin (6)
можно использовать в качестве оценки для д.
Вернемся к случаю независимых хирс помощью (1) вычислим дисперсию S:
= & S2 = &(2 WuY-
396
Гл. XIII. Корреляция
Вычисления полностью приводятся в § 5.6 книги Кендалла. Поэтому мы укажем лишь результат:
„2 _п[п— 1) (2п + 5)
— 18 .
Отсюда, в силу (2), следует, что
__2_ 2(2w + 5) /о\
г 9 п(п— 1) '
Если таким же образом вычислить и высшие моменты g Т4„ g Тй,. . . (моменты нечетного порядка равны нулю, так как значения Т и — Т всегда имеют равные вероятности), то окажется, что
они при п —> оо асимптотически равны соответствующим моментам нормального распределения с дисперсией о-?:
(9>
Отсюда следует, что случайная величина Т распределена асимптотически нормально с нулевым средним значением и дисперсией (8).
Асимптотическая нормальность остается справедливой даже
и. в том случае, когда х и у являются зависимыми величинами е произвольной функцией распределения, если только абсолютная величина математического ожидания g Т не слишком близка к единице. Доказательство см. в книге: Kendall М. G., Rank correlation methods 5.21.