находим

где значение t удовлетворяет равенству

Пример. Произведено 16 измерений случайной величины Х. Вычисленные по результатам измерений оценки характеристик случайной величины Х следующие:

Определить доверительный интервал для математического ожидания с надежностью 0,9.

Решение: Из таблицы функции Лапласа, определяем, что если , то

Тогда

Таким образом, интервал накрывает точку с вероятностью 0,9.

Для дисперсии гауссовой случайной величины Х приближенное значение может быть вычислено по формуле:

а для корреляционного момента:

Приведенные формулы для определения доверительного интервала дают хорошие результаты для оценки математического ожидания при а для дисперсии и корреляционного момента - при n>20...30.

При меньшем числе опытов результаты получаются приближенными.

В заключение приведем оценку вероятности события. Пусть произведено n независимых опытов, в которых событие А появилось m раз. Требуется оценить вероятность этого события p. Несмещенной и состоятельной оценкой вероятности события является его частота

Вероятность того, что ошибка оценки вероятности события не превысит

где

В большинстве практических задач вероятность p заранее неизвестна, поэтому ее заменяют приближенным значением . Тогда получаем приближенную формулу для определения доверительной вероятности:

Необходимое число опытов для получения оценки вероятности события с доверительной вероятностью и доверительным интервалом определяется из формулы:

где определяется исходя из равенства частота событий в первой серии опытов;

Здесь, как видим, вместо используется Это обусловлено тем, что вопрос о необходимом числе опытов поставлен до их проведения.

НЕ нашли? Не то? Что вы ищете?

Пример. При 600 бросаниях монеты герб выпал 312 раз. Найти вероятность того, что ошибка от замены вероятности частотой не превысит

Решение: Оценка вероятности

Тогда

Искомая вероятность

Итак, с довольно высокой вероятностью 0,986 можно утверждать, что при n=600 бросаниях монеты ошибка от замены вероятности частотой не превысит 0,05.

Выводы

1. Одна из центральных задач математической статистики заключается в вычислении на основе имеющихся статистических данных (ограниченной выборки) как можно более точных приближенных значений (статистических оценок) одной или нескольких числовых характеристик исследуемой случайной величины.

Принципиальная возможность получения работоспособных приближений такого рода на основании статистического обследования лишь части анализируемой генеральной совокупности (т. е. на основании ограниченного ряда наблюдений, или выборки) обеспечивается замечательным свойством статистической устойчивости оценок числовых характеристик.

2. Свойство состоятельности оценки обеспечивает ее статистическую устойчивость, т. е. сходимость (по вероятности) к истинному значению оцениваемого параметра по мере роста объема выборки, на основании которой эта оценка строится. Свойство несмещенности оценки заключается в том, что результат усреднения всевозможных значений этой оценки, полученных по различным выборкам заданного объема, даст в точности истинное значение оцениваемого параметра.

3. С учетом случайной природы каждого конкретного оценочного значения числовой характеристики случайной величины представляет интерес определения доверительных интервалов, которые с наперед заданной (и близкой к единице) вероятностью накрывали бы истинное значение оцениваемого параметра.

Обработка результатов наблюдений по методу наименьших квадратов

Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число опытов ограничено. Только при очень большом числе опытов эти случайности сглаживаются, и явление обнаруживает в полной мере присущие ему закономерности.

Случаен ступенчатый вид статистической функции распределения непрерывной случайной величины; случайна форма гистограммы, ограниченной тоже ступенчатой линией. Поэтому на практике часто приходится решать вопрос о том, как подобрать для данного статистического распределения аналитическую формулу, выражающую лишь существенные черты статистического материала. Такая задача называется задачей выравнивания статистических распределений.

Обычно выравниванию подвергаются гистограммы. Задача сводится к тому, чтобы заменить гистограмму плавной кривой, имеющей достаточно простое аналитическое выражение, и в дальнейшем пользоваться ею в качестве плотности распределения (рис.4).

Рис. 4-ст.

Для нахождения оценок параметров функциональной зависимости применяется метод наименьших квадратов. При этом метод наименьших квадратов не решает вопроса вида аналитической функции, а дает возможность при заданном типе аналитической функции y=f(x) подобрать наиболее вероятные значения для параметров этой функции. Например, если несколько полученных в опыте точек на плоскости, ход расположены приблизительно прямой (рис.5),

Рис. 5-ст.

то естественно возникает идея заменить эту зависимость линейной функцией y=kx+a, для которой требуется определить лишь параметры а и k. Если зависимость явно нелинейная (рис.6), в качестве аппроксимирующей кривой выбирают многочлен (в частном случае, параболу).

Рис. 6-ст.

При этом необходимо иметь в виду, что если производится выравнивание гистограмм, то соответствующая функция должна обладать основными свойствами плотности:

Сущность метода наименьших квадратов заключается в следующем. Пусть зависимость у от х выражается формулой

где - подлежащие определению параметры.

В результате n независимых опытов были получены следующие данные, оформленные в виде статистической таблицы:

Номер опыта

1

2

...

k

...

n

xi

x1

x2

...

xk

...

xn

yi

y1

y2

...

yk

...

yn

Согласно методу наименьших квадратов, наивероятнейшие значения параметров дают минимум функции

Если имеет непрерывные частные производные по всем неизвестным параметрам то необходимое условие минимума функции S представляет систему уравнений с m+1 неизвестными:

Если в качестве аппроксимирующей функции взят многочлен, т. е.

то оценка его коэффициентов определяются из системы m+1 линейных уравнений:

Если значения хi известны без ошибок, а значения yi независимы и равноточны, то оценка дисперсии величины yi определяется формулой

где - значение, вычисленное в предположении, что коэффициенты поли....... заменены их полученными оценками.

При гауссовом законе распределения величин yi изложенный метод дает минимальную ошибку.

Пример 1. Найти оценки параметров линейной функции

Решение. Для определения коэффициентов и методом наименьших квадратов составляем систему

Решая систему получаем

где

Пример 2. С помощью прибора измеряется какой-то параметр . Случайная величина Х - ошибка измерения параметра . С целью исследования точности прибора произведено n=500 измерений этой ошибки. Результаты измерений сведены в группированный статистический ряд:

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17