Теория вероятностей и ее инженерные приложения - Вентцель Е.С.
ISBN 5-06-003830-0
Скачать (прямая ссылка):


Рассмотрим вопрос об определении числовых характеристик с. в. X по результатам п независимых опытов. Допустим, что опыты еще не произведены, их результаты нам неизвестпы, случайны. Обозначим Xi значение, которое примет с. в. X в i-u опыте; результаты опыта — п независимых случайных величин:
X11 X2, X4 Xn. (11.6.1)
Будем рассматривать их как п «экземпляров» случайной величины X, каждый из которых имеет тот же закон распределения, что и сама с. в. X.
Предположим, что мы хотим определить (пусть приближенно) по результатам п опытов (11.6.1) пекоторый параметр а, связанный с закопом распределения с. в. X. Будем называть приближенное значение параметра а его
452 ГЛ. і і. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
оценкой. Любая оценка, вычисляемая на основе экспериментальных данных (11.6.1), есть функция этих случайных величин и, значит, тоже случайная величина. Обозначим а оценку параметра а:
S = Cp(X1, X2, ...,Xn). (11.6.2)
Например, естественной оценкой для математического ожидания тх с. в. X является среднее арифметическое ее наблюденных значений:
п
тх = т*х==^^Х{ (11.6.3)
(в других случаях выбор оценки может быть не столь очевидным, как мы убедимся ниже).
Итак, любая оценка а параметра а —- случайная величина — функция п случайпых величии X1, X2, ..., Xn (п «экземпляров» случайной величины X). Закон распределения этой с. в. а зависит от закона распределения с. в. X и от вида функции ф, выражающей а через X1, X2, ..., Xn, а значит и от числа опытов п. Этот закон распределения может быть найден методами теории вероятностей; иногда он, на наше счастье, оказывается довольно простым. Предъявим к оценке а ряд требований, которым она должна удовлетворять, чтобы быть в каком-то смысле «доброкачественной» оценкой.
Естественно потребовать от оценки а, чтобы при увеличении числа опытов п она приближалась (сходилась
по вероятности) к искомому параметру a ^-—"^^j-
Оценка, обладающая таким свойством, называется со-стоятельной.
Кроме того, желательно, чтобы, пользуясь величиной а вместо а, мы по крайней мере не делали систематической ошибки в сторону завышения или занижения, т. е. чтобы выполнялось условие:
M [а] = а. (11.6.4)
Оценка, обладающая таким свойством, называется несмещенной.
Наконец, желательно, чтобы выбранная несмещенная оценка была как можпо менее случайной, т. е. обладала по сравнению с другими минимальной дисперсией:
D [а] = min, (11,6.5)
11.6. ОЦЕНКА ЧИСЛОВЫХ ХАРАКТЕРИСТИК
453
Оцепка, обладающая таким свойством, называется эффективной.
На практике не всегда удается удовлетворить всем этим требованиям. Например, иногда формулы для вычисления эффективной оценки слишком сложны, и приходится удовлетворяться другой оценкой, дисперсия которой несколько больше. Иногда применяются — в интересах простоты расчетов — незначительно смещенные оценки.
Так или иначе, при выборе оценки любого параметра желательно ее критическое рассмотрение со всех вышеупомянутых точек зрения.
Здесь мы ограничимся нахождением — по результатам опытов (11.6.1) оценок для математического ожидания m и дисперсии D случайной величины X : M [X] =пг; D[X] = D.
Мы уже упоминали, что естественной оценкой для математического ожидания m случайной величины X является среднее арифметическое ее наблюденных значений (или статистическое среднее):
п
,7* = m* - -L X1. (11.6.6)
i=*l
Нетрудно убедиться, что эта оценка состоятельна: согласпо закону больших чисел (п. 10.1) при увеличении числа опытов п она сходится по вероятности к математическому ожиданию m случайной величины X.
Посмотрим, является ли эта оценка несмещенной? Для этого найдем ее математическое ожидание:
[п "1 п п
i=l J і=1 і=1
(11.6.7)
то есть оценка in для m является несмещенной. Найдем дисперсию этой оценки:
п п
D [m] - D [m*] = Д> 2 D Iх й = k 2 D = (11-6-8)
Эффективность или неэффективность оценки зависит от вида закона распределения с. в. X. Можно доказать (мы этого делать не будем), что если с. в, X распреде-
454
ГЛ, И. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
лена нормально, то оценка т = т* для математического ожидания т является и эффективной.
Перейдем к оценке для дисперсии D. На первый взгляд наиболее естественной представляется статистическая дисперсия D*, то есть среднее арифметическое квадратов отклонений значений X, от среднего:
(11.6.9)
г=1
Проверим, состоятельна ли эта оценка? Выразим ее через статистический второй начальный момент, т. е. через среднее арифметическое квадратов наблюденных значений:
D*
т
(11.6.10)
Первый члеп в правой части —- среднее арифметическое наблюденных значений случайной величины X2 сходится по вероятности к ее м.о.: M [X2] = а2 [X]. Второй член сходится по вероятности к т2; вся величина (11.6.10) сходится по вероятности к а2 — m2 = D. Значит, оценка (11.6.9) состоятельна.
Проверим, является ли она также и несмещенной? Подставим в (11.6.9) вместо т его выражение (11.6.6) и произведем указанные действия:



