Теория вероятностей и ее инженерные приложения - Вентцель Е.С.
ISBN 5-06-003830-0
Скачать (прямая ссылка):


Частоты
0,29
0,15
0,06
(11.3.1)
Деля каждую частоту р* па длину соответствующего разряда Д< = хі+і — = 10, получим таблицу плотностей частоты і і :
Разряды
704-80
80+90
90+100
Плотпость частоты
0,002
0,014
0,034
Разряды
1004-110
1104-120
1204-130
Плотность частоты
0,029
0,015
0,006
попало в г-й разряд (хі-г-хі+і), к общему числу п произведенных опытов.
Сразу же возникает вопрос: а как быть, если значение с. в. X попало в точности на границу между разрядами? К какому разряду его отнести? Это неважно: можно отнести значение либо к левому разряду, либо к правому (ведь вероятность того, что непрерывная с. в. X примет заранее заданное значение, равна пулю); мы остановимся на более симметричном «справедливом» правиле: если значение с. в. попало в точности на границу разрядов, разделить его поровну между соседними разрядами и прибавить по 1/2 к числам I1 для обоих разрядов.
Построим группированный статистический ряд для св. X1 рассмотренной в предыдущем п. (табл. 11.2.1, 11.2.2, 11.2.3). Выберем границы разрядов «круглыми»: (70^80); (80 -г- 90); (90 ч-100); (100 4-110); (110-5-+ 120); (120 4-130).
Подсчитывая количество значений с в., попавших в каждый разряд (считая половинки от попавших в границу между разрядами) и деля на число опытов п = 100, получим группированный статистический ряд:
11.3. ГРУППИРОВАННЫЙ СТАТИСТИЧЕСКИЙ РЯД
439
Откладывая по оси абсцисс разряды и строя на каждом разряде как на основании прямоугольник площади Pij получим гистограмму — статистический аналог кривой распределения (рис. 11.3.1)*).
70 80 90 100 110 120 UOx Ряс. 11.3.1
Имея в своем распоряжении группированный статистический ряд, мы можем приближенно построить статистическую функцию распределения F*(x). В качестве тех значений X1 для которых вычисляется F*(x), естественно взять границы разрядов. Так, например, для с. в. X, рассмотренной в предыдущем пункте, пользуясь группированным статистическим рядом (11.3.1), находим: F* (70) = 0; F* (80) = - Р* {X < 80} = 0,02;
70
13Ox
90 110 Рис. 11.3.2
F* (90)=Р* {Х< 90}=0,16; F* (100) = Р* (X < 100} =0,50;
*) В рассмотренном выше примере число опытов было сравнительно невелико (п = 100) и, соответственно ему, мы взяли очень псболынос число разрядов (к = 6). Вообще говоря, для построения (хотя бы ориентировочного) закона распределения непрерывной с. в. X по опытным данным и число опытов п, и число разрядов к должны быть существенно больше. Ориентировочно можно назвать число опытов п, необходимое для того, чтобы с удовлетворительной точностью представить себе распределение интересующей нас с. в. X: оно должпо быть порядка нескольких сотен. Соответственно число к разрядов, на которое делится интервал наблюдавшихся значений с. в., должен быть больше, чем в рассмотренном нами примере; обычпо его выбирают порядка 12 -4- 20.
440 ГЛ. 11. ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
F* (110) = Р* (Z < 110} = 0,79; F* (120) = Р* {X < 120} = = 0,94; F* (130) = 1.
График статистической функции распределения показан на рис. 11.3.2 (точки соединены отрезками прямых),
11.4. Выравнивание статистических распределений
Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число опытов ограничено, что произведены именно те, а не другие опыты, давшие именно те, а не другие результаты. Только при очень большом числе опытов эти случайности сглаживаются, и явление обнаруживает в полной мере присущие ему закономерности. На практике мы почти никогда не располагаем таким большим числом опытов (наблюдений) и вынуждены считаться с тем, что любому статистическому распределению присущи в той или иной мере черты случайности. Случаен ступенчатый вид статистической функции распределения непрерывной св.; случайна форма гистограммы, ограниченной тоже ступенчатой линией. Неудобно пользоваться такими негладкими функциями при дальнейшем их преобразовании. Поэтому на практике часто приходится решать вопрос о том, как подобрать для данного статистического распределения аналитическую формулу, выражающую лишь существенные черты статистического материала, но не случайности, связанные
ражепие, и в дальнейшем пользоваться ею в качестве плотности распределения f(x) (рис. 11.4.1).
Как подобрать наилучшим образом плавную кривую, выравнивающую "гистограмму? Это задача в значительной мере неопределенная, как и любая задача об анали-
-F(x)
с недостаточным объемом опытных данных. Такая задача называется задачей выравнивания статистических распределений.
Рис. 11.4.1
Обычно выравниванию подвергаются гистограммы. Задача сводится к тому, чтобы заменить гистограмму плавпой кривой, имеющей достаточно простое аналитическое вы-
і і.4. ВЫГЛВИИВЛНИЕ РАСПРЕДЕЛЕНИЙ
441
тическом представлении эмпирических функций. Например, если несколько полученных в опыте точек на плоскости хОу расположены приблизительно по прямой (рис. 11.4.2), естественно возникает идея заменить эту зависимость линейной функцией. Если зависимость явно нелинейна (рис. 11.4.3), в качестве аппроксимирующей



