Непрерывные СВ - это СВ, возможные значения которых непрерывно заполняют некоторый конечный или бесконечный интервал.

Плотностью распределения вероятностей (или плотностью распределения, плотностью вероятности) непрерывной СВ X называется производная от её функции распределения:

.

Непрерывная СВ X распределена равномерно на отрезке [а; b], если её плотность имеет вид

.

Непрерывная СВ X, принимающая неотрицательные значения, имеет показательное (экспоненциальное) распределение с параметром l, если её плотность распределения имеет вид

где l - среднее значение числа появления события в заданном интервале времени.

Непрерывная СВ X имеет нормальное распределение (Гаусса) с параметрами m и s > 0, если её плотность распределения имеет вид

, Х Î (-¥, +¥).

Вероятность попадания нормально распределённой СВ в заданный интервал

,

где F(х) - функция распределения нормального распределения с параметрами 0 и 1, называемая интегралом Лапласа или интегральной функцией Лапласа. Эта функция затабулирована (см. [1], приложение 1); является нечётной, т. е. F(-х) = - F(х).

Тема 6. Числовые характеристики случайных величин

Математическое ожидание случайной величины - это характеристика положения случайной величины на числовой оси, определяемая по формуле

Основные свойства математического ожидания:

1. Математическое ожидание постоянной С равно этой постоянной, т. е.

МС = С.

2. Постоянную величину С можно выносить за знак математического ожидания, т. е. М(С×Х) = С×МХ.

НЕ нашли? Не то? Что вы ищете?

3. Математическое ожидание функции Y = g(X) от СВ Х вычисляется по формуле

где pi - вероятности распределения дискретной СВ; f(x) - плотность распределения непрерывной СВ.

4. Математическое ожидание произведения взаимно независимых случайных величин равно произведению математических ожиданий сомножителей: М(ХХХ3×…×Хп) = М(Х1)×М(Х2)×М(Х3)×…× М(Хп).

5. Математическое ожидание суммы случайных величин равно сумме математических ожиданий слагаемых:

М(Х1 + Х2 + Х3 +…+ Хп) = М(Х1) + М(Х2) + М(Х3) +…+ М(Хп).

Дисперсия случайной величины - это характеристика рассеивания значений случайной величины около её математического ожидания, определяемая по формуле

.

Если СВ X дискретна и известен её закон распределения, то дисперсия

.

Если же СВ X непрерывна и известна её плотность f(x), то дисперсию находят так:

.

Основные свойства дисперсии:

1. Дисперсия любой СВ неотрицательна, т. е. DX ³ 0.

2. Дисперсия постоянной величины С равна нулю, т. е. ³ 0.

3. Дисперсия произведения СВ X на постоянную С равна произведению дисперсии СВ X на квадрат постоянной: .

4. Дисперсия СВ X не изменится, если к СВ прибавить постоянную величину, т. е. D(C + Х) = DX.

5. Дисперсия суммы двух случайных величин равна сумме дисперсий этих величин и удвоенной ковариации между ними:

.

Ковариация независимых СВ X и Y равна нулю. Для таких величин дисперсия, как их суммы, так и разности равна сумме дисперсий:

.

Среднеквадратическим отклонением случайной величины X называют значение квадратного корня из дисперсии данной величины:

.

Степень зависимости между СВ обычно оценивают с помощью числовых характеристик зависимости, среди которых особую роль играет ковариация.

Ковариация случайных величин X и Y – это математическое ожидание произведения центрированных величин:

.

Ковариация вычисляется по формуле:

Ковариация СВ описывает, помимо рассеивания СВ X и Y, связь между ними: если случайные величины X и Y независимы, то .

Коэффициентом корреляции случайных величин X и Y называют нормированную ковариацию случайных величин X и Y:

,

где DX, DY – дисперсии случайных величин X и Y.

Случайные величины, имеющие нулевой коэффициент корреляции, называют некоррелированными.

Решите задачу 5 Вашего варианта контрольного задания.

Тема 7. Вариационные ряды и способы их представления

К методам математической статистики прибегают в тех случаях, когда требуется изучить распределение большой совокупности однородных предметов (явлений, объектов, индивидуумов) по некоторому признаку. Например, когда необходимо проанализировать распределение множества осуждённых по возрасту, статье, сроку наказания и т. д.

Множество всех предметов изучаемой совокупности принято называть генеральной совокупностью, а их число N - объёмом генеральной совокупности.

В математической статистике используются два основных метода наблюдений: метод сплошных наблюдений и метод выборочных наблюдений.

Метод сплошных наблюдений основывается на исследовании всех предметов генеральной совокупности. При методе выборочных наблюдений из генеральной совокупности выбирают лишь часть предметов и их подвергают исследованию.

Выборкой (или выборочной совокупностью) называется множество предметов, отобранных для исследования из генеральной совокупности, а их число п - объёмом выборки.

Для формирования по выборке достоверного суждения об исследуемом признаке генеральной совокупности необходимо, чтобы объём выборки был достаточно велик и предметы выборки правильно представляли генеральную совокупность, т. е. выборка должна быть репрезентативной (представительной). Репрезентативность достигается специальными приёмами случайного отбора из генеральной совокупности каждого из предметов выборки.

Совокупность значений a1, a2, ..., aп, которые приняла случайная величина Х в п наблюдениях, называют статистическим рядом.

Упорядоченная по величине последовательность выборочных значений (равные между собой члены выборки нумеруются в произвольном порядке) х1 £ х2 £ ... £ хk называется вариационным рядом, а расстояние между крайними членами вариационного ряда - размахом вариационного ряда.

Для дискретной СВ естественной формой эмпирического закона являются таблицы частот или таблицы эмпирического (статистического) распределения выборки, показывающие, с какой частотой наблюдалось то или иное значение величины Х.

Относительной (или эмпирической) частотой значения хi в выборке объёма п является отношение

,

где mi - число повторений значения хi (варианты) в выборке.

Таблица частот выглядит следующим образом:

Варианты (хi)

хl

х2

. . .

хk

Частоты ()

. . .

Для непрерывной СВ эмпирический закон распределения задают с помощью интервальной таблицы частот, имеющей вид:

Интервалы значений (хi)

(cl; c2)

(c2; c3)

. . .

(; )

Частоты ()

. . .

Здесь в первой строке записаны интервалы изменения (группировки) величины Х: весь диапазон изменения величины Х разбит на l интервалов (границами i-го интервала являются и ), а mi () характеризует число наблюдений, попавших в i-й интервал.

Примечание. Для количества l чисел, равных концу интервала, поступают следующим образом: а) для чётных l - половина записывается в этот интервал, половина - в следующий; б) для нечётных - первому интервалу присваивается , второму - значений.

Для наглядного представления эмпирического распределения используются графические изображения вариационных рядов в виде: гистограммы, полигона и кумуляты. Гистограмма и полигон представляют собой графическое представление эмпирического закона распределения, а кумулята – эмпирической функции распределения случайной величины Х.

Решите задачу 6 Вашего варианта контрольного задания.

Тема 8. Оценки параметров эмпирического распределения

Любая оценка параметра Q выборки (обозначим её ) представляет собой некоторую функцию = (х1, ... , хп), зависящую от выборки и поэтому являющуюся случайной величиной. Такие оценки называются статистиками.

Если в качестве оценки параметра ищется число, то оценка называется точечной.

Эмпирическим (или выборочным) средним называют математическое ожидание оцениваемого признака, вычисленное для выборки по таблице эмпирического распределения:

где n – объём выборки; xi - i-е значение (или среднее значение для интервала) оцениваемого признака; k – количество повторяющихся значений (или интервалов) оцениваемого признака; - частота повторяющихся значений (или i-го интервала).

Эмпирической (или выборочной) дисперсией называют дисперсию оцениваемого признака, вычисленную для выборки по таблице эмпирического распределения:

Для получения несмещённой оценки дисперсии надо ввести поправку:

.

Эмпирическим среднеквадратическим отклонением sвыб называют значение квадратного корня из эмпирической дисперсии оцениваемого признака: .

Однако если число наблюдений мало, то случайный характер величины может привести к значительному расхождению между Q и . Возникает задача интервальной оценки параметра Q, т. е. оценки не одним числом, а интервалом так, чтобы вероятность поглощения этим интервалом параметра Q, т. е. вероятность двойного неравенства

,

была не меньше заданного числа a (0 £ a £ 1).

Вероятность a называется доверительной вероятностью (или уровнем доверия), а соответствующий интервал доверительным интервалом с уровнем доверия a.

Доверительный интервал для математического ожидания т нормального распределения с уровнем доверия a при известном среднеквадратическом отклонении s или установленным по выборке достаточно большого объёма () определяется из соотношения:

,

где - аргумент функции Лапласа F(х), для которого F() = a/2 (определяется из таблицы, представленной в [1], приложение 1).

Доверительный интервал для m при неизвестном s определяется из соотношения:

,

где - значение распределения Стьюдента функции с степенями свободы и уровнем доверия a (определяется из таблицы, представленной в [1], приложение 2); s - несмещённая оценка для среднеквадратического отклонения.

Решите задачу 7 Вашего варианта контрольного задания.

Тема 9. Статистическая проверка гипотез

Под статистической гипотезой понимается любое предположение относительно произвольной статистики, которое можно проверить, опираясь на результаты наблюдений в случайной выборке.

В качестве статистических гипотез возможно рассмотрение предположений о виде неизвестного распределения, о параметрах генеральной совокупности известных распределений, о равенстве параметров двух или нескольких распределений, о независимости выборок.

Обычно исследование начинается с того, что какая-либо гипотеза, которая из неформальных соображений представляется хорошо согласующейся с ожидаемыми эмпирическими данными, объявляется основной (нулевой) и обозначается Н0. Альтернативная (конкурирующая) гипотеза, утверждающая, что гипотеза Н0 неверна, обозначается Н1. В действительности верна одна и только одна из гипотез (Н0 или Н1), но какая именно – заранее неизвестно. В этой связи строится процедура проверки гипотезы (критерий согласия), позволяющая по результатам наблюдений принимать или отвергать данную гипотезу.

Выборочное пространство X разбивается на две непересекающихся области: и . Уровень доверия a (вероятность попадания в область ) принимается близким к единице. Величину называют уровнем значимости и обычно берут равной 0,05; иногда 0,01 или 0,005.

Правило проверки гипотезы формулируется следующим образом.

Если результаты наблюдений , то считается, что гипотеза H0 подтверждается эмпирическими данными, т. е. гипотеза H0 принимается. Если же выборочное значение , то предполагается, что данная гипотеза H0 не согласуется с результатами наблюдений, т. е. H0 отвергается.

Область называют областью принятия гипотезы, область критической областью (или критерием гипотезы).

Применение процедуры проверки гипотезы сопряжено с ошибками двух родов:

отвергнуть гипотезу, когда она верна (ошибка первого рода);

принять гипотезу, когда она неверна (ошибка второго рода).

Вероятности ошибок первого (g) и второго рода (b) можно представить условными вероятностями:

g = P (отклонения НН0 – верна) = ,

b = P (принятия НН0 – ложна) = .

Если выборочные данные , тогда с вероятностью ошибки первого рода наблюдается случайное событие, которое противоречит гипотезе. Если вероятность такого случайного события незначительна, значит, наблюдается практически невозможное событие и данная гипотеза должна быть отвергнута.

Для проверки гипотез о виде распределения используют критерий Пирсона (хи-квадрат). В качестве основной гипотезы (Н0) принимается утверждение о том, что исследуемая генеральная совокупность имеет заданный закон распределения. Альтернативная гипотеза Н1, как правило, не высказывается, и задача ставится так: согласуются ли данные выборки с предполагаемым законом распределения?

Для проверки гипотезы Н0 критерий Пирсона имеет вид

,

где mi – число наблюдений, попавших в i-й интервал выборки; – ожидаемое (для предполагаемого закона распределения) число попаданий в i-й интервал; k – число интервалов.

Далее по таблице критических точек распределения (см. [1], приложение 3) для заданного уровня значимости g и числа степеней свободы (где r – число параметров предполагаемого закона распределения) находится критическая точка . Принимается одно из решений:

1) принять гипотезу Н0 (генеральная совокупность распределена по предполагаемому закону), если ;

2) отклонить гипотезу Н0, если .

Дополнительные рекомендации. Самостоятельная работа должна носить систематический и непрерывный характер в течение всего семестра (периода между сборами). Время для самостоятельной работы отводится каждым студентом, исходя из фактического уровня знаний, умений и навыков по курсу, но не менее 66 часов (по три-четыре часа еженедельно). При этом на разовое изучение учебного материала желательно выделять не менее одного часа.

Правило выбора варианта контрольного задания: номер варианта соответствует последней цифре номера личной зачётной книжки. Например, если последняя цифра номера личной зачётной книжки «3», то номер варианта - 3; если последняя цифра - «0», то номер варианта - 10.

Задачи, которые необходимо выполнить по данному варианту, выбираются из раздела «Варианты контрольных заданий».

Студент должен проявить максимум самостоятельности.

Контрольное задание оформляется на листах формата А4 (210´297 мм). Все страницы, исключая титульный лист, нумеруются. Образец титульного листа контрольного задания приведен в приложении 1. Вид представления - рукописный или электронный - определяется студентом, исходя из личных возможностей. В силу большей оперативности проверки работ с сайта филиала и проставления результата в электронной ведомости, электронный вид представления контрольного задания является предпочтительным.

При представлении работы в электронном (машинописном) виде необходимо выдерживать следующие параметры текстового процессора: поля: верхнее – 2 см; нижнее – 2 см; левое – 2,5 см; правое – 1,5 см; переплёт – 0 см; колонтитулы – 1,25 см; шрифт – Times New Roman; высота шрифта – 14; ориентация страницы – книжная; отступ абзаца – 1,25 см; межстрочное расстояние – одинарное; выравнивание – по ширине; стиль текста – обычный.

Задачи и их решения (независимо от варианта оформления) излагаются (не оставляя пустые строки) последовательно, на одной стороне каждой страницы. При отсутствии решения излагать задачу не обязательно.

Для решения задач, требующих проведения сложных вычислений, целесообразно использование соответствующих прикладных компьютерных программ. Например, табличного процессора Microsoft Excel. Корректное применение таких программ позволит сэкономить время и избежать возможных ошибок в вычислениях.

Общее требование к рукописным работам – они должны быть читаемы, т. е. доступными для прочтения другими людьми и не содержать неоднозначно воспринимаемых букв.

Окончательно оформленное контрольное задание должно поступить (сдаётся лично или отправляется по электронной почте через сайт филиала – www. *****) на кафедру (ауд. 316) не позднее, чем за неделю до начала учебных сборов.

Контрольное задание засчитывается, если не менее 70% задач решены верно. В противном случае работа возвращается на доработку. Студенты, не получившие зачёт за контрольное задание, к сдаче зачёта по курсу не допускаются.

Одной из форм оказания помощи студентам в самостоятельном изучении учебного материала являются консультации, проводимые кафедрами. Каждая кафедра составляет расписание консультаций с указанием дней, часов, места их проведения и консультирующего преподавателя. Дополнительное время проведения консультаций преподавателями по курсу следует уточнять в период установочных сборов.

Посещение консультаций студентами добровольное. Консультации проводятся, как правило, индивидуальные. Их целями являются разъяснение вопросов, возникающих у обучаемых при самостоятельном изучении учебного материала и подготовке контрольного задания, углубление и закрепление знаний по отдельным вопросам и темам курса, оказание методической помощи в выборе рациональных методов самостоятельной работы. При необходимости (по просьбе старосты учебной группы) могут проводиться и групповые консультации.

Варианты контрольных заданий

Вариант 1

1. Имеется три разных письма, каждое из которых можно послать по одному из шести адресов. Сколько есть способов рассылки писем, если нельзя посылать более одного письма по одному адресу?

2. Собрание, на котором присутствует 20 мужчин и 10 женщин, выбирает делегацию из четырёх человек. Каждый может быть избран с равной вероятностью. Найти вероятность того, что в делегацию войдут 3 женщины.

3. На склад поступает продукция трёх фабрик. Причём продукция первой фабрики составляет 20%, второй - 45% и третьей - 35%. Известно также, что средний процент нестандартных изделий для первой фабрики равен 5%, для второй - 2% и для третьей - 1%. Наудачу взятое изделие оказалось стандартным. Какова вероятность того, что оно произведено на третьей фабрике?

4. Закон распределения случайной величины X задан таблицей:

хi

-3

2

1

0

3

5

рi

0,05

0,25

0,25

0,2

0,15

0,1

Построить многоугольник распределения вероятностей величины X. Найти математическое ожидание, дисперсию и среднеквадратическое отклонение данной случайной величины.

5. В таблице приложения 2 приведена последовательность случайных значений оцениваемого параметра. Сделайте выборку (n = 60), начиная с 1-го значения. Возьмите в качестве интервалов группировки интервалы (0; 20), (20; 40), ..., (80; 100) и напишите таблицу эмпирического распределения для этих интервалов. Постройте гистограмму, полигон, эмпирическую функцию распределения. Сделайте вывод о виде закона распределения оцениваемого параметра.

6. Используя таблицу эмпирического распределения, полученную при выполнении задания 5, найдите эмпирические среднее, дисперсию и среднеквадратическое отклонение оцениваемого параметра.

7. Используя результаты решения задания 6, для уровня значимости 0,05 проверьте основную гипотезу Н0 о распределении значений оцениваемого параметра по принятому закону.

Вариант 2

1. Металлург, изучающий сплавы, при проведении эксперимента может использовать три различных температурных режима, четыре различных значения времени остывания и три различных присадки меди. Выбор температурного режима, значения времени остывания и типа присадки полностью определяют эксперимент. Сколько различных экспериментов может провести металлург?

2. В ящике имеется 28 деталей, из которых 6 бракованных. Из ящика наудачу извлекают 3 детали. Какова вероятность того, что среди них нет бракованных?

3. В двух ящиках содержится по 15 деталей, причём, в первом 10, а во втором 12 деталей стандартных. Из первого ящика наудачу взяли деталь и переложили во второй. Найти вероятность того, что наудачу извлечённая после этого деталь из второго ящика будет стандартной.

4. Закон распределения случайной величины X задан таблицей:

хi

-1

0

1

2

3

4

рi

0,05

0,25

0,25

0,2

0,15

0,1

Построить многоугольник распределения вероятностей величины X. Найти математическое ожидание, дисперсию и среднеквадратическое отклонение данной случайной величины.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5