Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

Рис. 10.3

Рис. 10.4

В отличие от полигонов, гистограммы частостей с уменьшением частных интервалов не опускаются на ось абсцисс, а колеблются около некоторой кривой, которая графически определяет некоторую функцию.

Эта функция характеризует уже распределение признака во всей генеральной совокупности. Она в свою очередь определяет генеральный закон распределения. Соответствующая кривая носит название кривой распределения. Знание этой функции в аналитическом виде (в виде формулы) для того или иного массового явления позволяет исчерпывающе изучать это явление методами математического анализа.

10.6. Статистические характеристики

Законы распределения в виде различных таблиц распределения, полигонов, гистограмм и т. д. дают общий характер распределения признака в выборке. По ним можно приблизительно судить о том, около какой средней величины группируются варианты, значительно ли они рассеяны по отношению к средней, симметрично распределены или нет и т. д. В частности, степень рассеяния оценивается с помощью крутизны графика. Но все это оценки субъективного характера, так как одному гистограмма может показаться достаточно крутой, а другому нет.

Математическая статистика позволяет характеризовать особенности распределения объективно – посредством особых величин, называемых статистическими характеристиками.

Статистическими характеристиками называются отдельные величины, которые характеризуют с той или иной стороны всю совокупность в целом.

Первой и простейшей статистической характеристикой является средняя величина признака (средняя длина волокна, средняя прочность пряжи, средний рост человека и т. д.). Легко, однако, убедиться, что одной средней величины признака недостаточно Необходима характеристика, дающая оценку рассеяния вариантов всей совокупности около средней.

НЕ нашли? Не то? Что вы ищете?

Пример 10.7. Две прядильные машины вырабатывают пряжу 25 текс. В результате испытаний некоторого количества полуметровых образцов на прочность и подсчета средней прочности образцов по каждой машине получены следующие результаты (табл. 10.10).

Таблица 10.10

Машина

Прочность Х образцов пряжи, сН

Средняя прочность, сН

Первая

210

260

270

280

330

270

Вторая

245

265

270

275

295

270

Для простоты расчетов в каждом случае проведено пять испытаний. На практике же таких испытаний осуществляют гораздо больше.

Если работу машин оценивать только по средней величине прочности пряжи, то может показаться, что обе машины работают одинаково. На самом же деле из таблицы видно, что вторая машина работает лучше, так как варианты прочности пряжи, вырабатываемой на этой машине, более сосредоточены около их средней. Продукция второй машины имеет меньшую неровноту (рассеяние) и, очевидно, поэтому вторая машина работает лучше, чем первая.

Пример 10.8. На прядильную фабрику поступил хлопок в кипах с двух хлопкоочистительных заводов. Требуется определить, можно ли из этого хлопка вырабатывать пряжу нужного текса, а если нельзя, то пряжу какого текса целесообразнее из него получать.

Прежде всего нужно найти среднюю длину волокна (ведь чем длиннее волокно, тем более низким может быть текс пряжи).

Проведенные измерения длины волокон из обеих кип дали результаты, представленные в табл. 10.11.

Таблица 10.11

Кипы

Длина волокна, мм

Средняя длина волокна, мм

Первая

25

30

35

40

40

34

Вторая

30

31

32

32

33

31,6

Как видно из табл. 10.11, средняя длина волокна из первой кипы больше, чем из второй, но отсюда еще не вытекает, что хлопок в первой кипе лучше. Во второй кипе хлопок ровнее, т. е. длины отдельных волокон распределены около своей средней величины (31,6) более сосредоточенно.

Итак, второй характеристикой должна быть мера рассеяния.

Но и этой характеристики иногда недостаточно, в связи с чем приходится вводить ряд других характеристик.

Некоторые из перечисленных характеристик имеют несколько разновидностей. В частности, средняя величина может быть арифметической, квадратической, кубической, геометрической, гармонической, модой и др.

Средняя арифметическая

Основным видом средней в математической статистике является средняя арифметическая величина. Она может быть простой или взвешенной, в зависимости от того, как дана совокупность – первоначальной таблицей или таблицей распределения частот.

Если совокупность дана первоначальной таблицей.

х1; х2; …; хn

то средняя арифметическая величина определяется формулой

Если совокупность дана таблицей распределения частот, то по формуле

(10.1)

В этом случае средняя арифметическая называется взвешенной.

Пример 10.9. Фабрика имеет пять цехов. В первом цехе работает 200 человек, во втором - 160, в третьем - 150, в четвертом - 100 и в пятом - 70. Рабочих, перевыполняющих месячное задание, имеется в каждом цехе соответственно 30, 40, 36, 50 и 60%. Необходимо найти средний процент рабочих, перевыполняющих месячное задание.

Определять этот средний процент как обычную среднюю арифметическую было бы неверным, так как проценты имеют различную «весомость» из-за различного количества рабочих по цехам. Величина 43,2% есть фактически средняя по цехам, но не по фабрике в целом. Чтобы получить средний процент рабочих, перевыполняющих месячное задание, с учетом их численности, следует определить взвешенную среднюю арифметическую величину:

Величины 200, 160, 150, 100 и 70 – это и есть веса. В данном случае они являются численностями вариантов 30, 40, 36, 50 и 60.

В рассматриваемом примере разница между обычной средней арифметической и взвешенной средней арифметической равна 3,5%, что по отношению к 39,7% представляет ошибку порядка 10%, т, е. величину абсолютно недопустимую.

Надо иметь в виду, что в случае непрерывного изменения признака средняя взвешенная величина является приближенной, так как все варианты, попадающие в тот или иной частный интервал Δх, заменены серединой интервала.

Мода

В текстильной практике применяется еще один вид средней величины – мода (например, модальная длина волокна).

Модой хмод при дискретном изменении признака называетсянаиболее часто встречающийся варианту; в случае непрерывного изменения признака мода – это значение признака с наибольшей плотностью.

(10.2)

где хм – начало интервала с наибольшей частотой тМ, а mМ-1 и mM+1 – частоты смежных интервалов.

Если статистическая совокупность дана в виде таблицы распределения частот или частостей, то за моду хмод приближенно можно принять середину частного интервала с наибольшей частотой (частостью).

Рис. 10.5

Мода хмод и средняя арифметическая , вообще говоря, отличны друг от друга. Они совпадают лишь при симметричном распределении признака. Поэтому, сравнивая и хмод можно судить о степени асимметрии распределения и ее направленности.

Рис. 10.6

Рис. 10.7

Несимметричные гистограммы или сглаживающие их кривые распределения могут иметь один из видов, изображенных на рис. 10.6 и 10.7. В первом случае (рис. 10.6) хмод < – асимметрия называется правой. Во втором случае (рис. 10.7) хмод > – асимметрия называется левой.

Пример 10.10. Определить направленность асимметрии по данным табл. 10.4 примера 10.4.

Вычисления по формулам (10.1) и (10.2) дают следующие результаты:

так как , имеем левую асимметрию (см. рис. 10.7)

Другие виды средних

Если исследование ограничивается только отысканием среднего значения признака в выборке, то целесообразно применять и другие виды средних:

среднее квадратическое

или

среднее кубическое

или

среднее гармоническое

или

среднее геометрическое

или

медиану, т. е. то значение признака, которое делит всю совокупность, представленную в виде вариационного ряда, на две равные по числу вариантов части,

Все эти виды средних отличны друг от друга; выбор вида зависит от конкретных условий задачи.

Средняя для совокупностей с качественным признаком

В предыдущих параграфах были рассмотрены различные виды первой статистической характеристики - средней величины признака – для совокупностей с количественными признаками, т. е. состоящих из числовых значений признака (вариантов) х1, х2, . . . , хп. Однако возможны ведь и совокупности с качественными признаками, состоящие из отметок, которые констатируют наличие или отсутствие некоторого качественного признака (Б – изделие с браком, – изделие без брака).

Статистическую совокупность с качественным признаком можно привести в соответствие с совокупностью с количественным признаком. Для этого достаточно элементы с наличием качественного признака обозначить через единицу, а элементы без этого признака через нуль. Если из п элементов совокупности т элементов обладают данным признаком и (п m) не обладают, то получим совокупность вариантов xi,, из которых т равны 1 и (nт) равны 0. Подсчитаем среднюю для этих вариантов хi.

Таким образом, средняя для совокупности вариантов 1 и 0, соответствующих наличию или отсутствию качественного признака в членах совокупности, равна частости членов, обладающих этим качественным признаком:

Например, если просмотр браковщицей 80 кусков товара показал, что четыре куска являются бракованными, то характеристикой среднего качества будет

т. е. 5%.

Размах

Размах (как и среднее абсолютное отклонение, коэффициент неровноты, дисперсия, среднее квадратическое отклонение и коэффициент вариации) представляет собой один из видов второй статистической характеристики – меры рассеяния.

Размахом R называется разность между наибольшим и наименьшим вариантами статистической совокупности:

Размахом пользуются тогда, когда нужно быстро и не очень точно определить рассеяние при небольшом числе испытаний (п < 10).

Пример 10.11. Дана статистическая совокупность 3, 1, 2, 8, 6.

Для этой совокупности R = 8-1 = 7.

Величина размаха R, очевидно, не изменилась бы, если совокупность была выражена таблицей распределения численностей. Иначе говоря, численности вариантов на размах не влияют.

Среднее абсолютное отклонение

Размах весьма приближенно характеризует рассеяние, так как при этом не учитывается рассеяние каждого варианта в отдельности. Рассеяние же каждого варианта xi определяется его отклонением от среднего значения , т. е. величиной

Казалось бы, можно оценить рассеяние вариантов во всей совокупности средней арифметической величиной из отклонений всех вариантов, т. е. величиной

Но таким способом находить меру рассеяния нельзя, поскольку среднее арифметическое отклонение вариантов от средней всегда тождественно равно нулю. Действительно,

Положительные и отрицательные отклонения полностью компенсируют друг друга.

Чтобы избежать обращения в нуль среднего отклонения из-за разницы в знаках, можно рассматривать абсолютные значения величин отклонений.

Средним абсолютным отклонением θ называется средняя арифметическая величина из абсолютных величин отклонений всех вариантов от их средней.

В зависимости от того, как представлена статистическая совокупность – первоначальной таблицей или таблицей распределения численностей – формула для θ будет иметь один из следующих видов:

(10.3)

или (10.4)

Пример 10.12. Наблюдение за числом остановов машины в час дало следующие результаты: 1; 3; 6; 8; 2. Определить среднее абсолютное отклонение. Так как среднее число остановов = 4, по формуле (10.3) имеем:

Пример 10.13. Дана таблица распределения численностей числа остановов X машины в час (табл. 10.12).

Таблица 10.12

Х

1

2

3

6

8

m

2

5

3

1

1

Определить среднее абсолютное отклонение.

Среднее взвешенное число остановов

Следовательно, по формуле (10.4) имеем:

Среднее абсолютное отклонение, как мера рассеяния, имеет весьма существенный недостаток: оно не реагирует на отдельные значительные отклонения нескольких вариантов при большом числе малых отклонений.

Пример 10.14. Дано 100 вариантов, из которых 99 имеют абсолютные отклонения, равные 0,1, и лишь один вариант – абсолютное отклонение, равное 2, т. е. в 20 раз больше, чем остальные.

Среднее абсолютное отклонение в этом случае

Оно, как видим, мало отличается от 0,1, но в восемь с лишним раз меньше, чем 2. Другими словами, одно большое отклонение очень мало повлияло на среднее абсолютное отклонение всех вариантов.

Указанный недостаток абсолютного отклонения при использовании последнего в текстильном производстве может быть чреват последствиями (если рассматривать абсолютное отклонение как меру неровноты продукта). Например, небольшое значение величины θ по прочности еще не означает, что отклонения от средней прочности на всех участках пряжи малы. Возможно наличие отдельных участков пряжи с резким отклонением прочности от средней, а это приводит к обрывам.

Коэффициент неровноты

Со средним абсолютным отклонением θ тесно связан другой вид меры рассеяния – коэффициент неровноты Н, с помощью которого в текстильном производстве длительное время определяли неровноту продукта.

Коэффициент неровноты вычисляют по формуле Зоммера, %:

где – общая средняя; – средняя из вариантов, меньших ; n – общий объем вариантов; nм – объем вариантов, меньших .

Можно показать, что коэффициент неровноты Н является относительным средним абсолютным отклонением, выраженным в процентах, т. е. что

(10.5)

или (10.6)

Коэффициент неровноты, будучи тесно связанным с абсолютным отклонением θ, обладает тем же недостатком: он не реагирует на отдельные большие отклонения вариантов при большом числе малых отклонений.

Пример 10.15. Даны два вариационных ряда измерений прочности пряжи: первый состоит из 99 измерений, равных 100, и одного, равного 1; второй ряд состоит из 50 измерений, равных 101, и 50, равных 97. В этом примере данные несколько утрированы для того, чтобы отчетливее был виден недостаток коэффициента неровноты. Тем не менее и такой случай может встретиться на практике, например если мы имеем дело со смесями большого количества сырья с одним средним значением признака и малого количества сырья со средним признаком, резко отличающимся от первого.

Если бы даны были не 100 измерений прочности образцов пряжи, а 100 каких-либо штучных изделий, качество каждого из которых не влияет на весь процесс производства, то можно было бы сказать, что качество продукции первого ряда ровнее качества продукции второго. При изъятии одного изделия с показателем 1, как бракованного, получилось бы 99% абсолютно ровной продукции. В этом случае следует признать, что неровнота первого ряда меньше, чем второго.

Но в прядении прочность одного участка пряжи, значительно меньшая прочности всех остальных участков, приводит к обрыву. Поэтому для текстильщиков первый ряд имеет явно большую неровноту, чем второй. Коэффициенты же неровноты, однако, у них почти одинаковые.

Действительно, для первого ряда имеем:

согласно формуле (10.6)

Для второго ряда имеем:

, , установили, что коэффициент неровноты Н, кроме указанного недостатка, обладает рядом других недостатков, которые часто делают анализ неровноты продукта в текстильном производстве с помощью этого коэффициента совершенно неудовлетворительным.

Для подтверждения сказанного достаточно привести один пример, данный .

Пример 10.16. Проведено по шесть испытаний пряжи с двух прядильных машин на прочность. После упорядочения результатов получены два вариационных ряда (сН):

Ряд I: 100, 100, 100, 200, 200, 200. Ряд II: 100, 100, 200, 200, 300, 300.

Очевидно, неровнота второго ряда больше неровноты первого, и тем не менее коэффициенты неровноты Н1 и Н11 одинаковы. В самом деле, ;

и по формуле (10.5) имеем:

Дисперсия

Среднее абсолютное отклонение θ введено в практику для того, чтобы избежать компенсации положительных и отрицательных отклонений при вычислении среднего отклонения. Но этого же можно достигнуть возведением в квадрат всех отклонений и нахождением среднего квадрата отклонений.

Дисперсией s2 называется средний квадрат отклонений всех вариантов от их средней.

В зависимости от того, как задана статистическая совокупность – первоначальной таблицей или таблицей распределения,– формула дисперсии будет иметь один из следующих видов:

(10.7)

или (10.8)

Пример 10.17. Числа остановов машины в час: 1, 2, 3, 6, 8. найти дисперсию.

Средняя для указанных вариантов ; поэтому, согласно формуле (10.7) ,

Пример 10.18. Совокупность дана таблицей распределения (табл. 10.13)

Таблица 10.13

Х

1

2

3

6

8

m

2

5

3

1

1

В данном случае

и, согласно формуле (10.8)

Дисперсия выражается в квадратных единицах измерения признака X. Чтобы получить величину меры рассеяния, выраженную в тех же единицах, что и признак X, достаточно из дисперсии извлечь корень квадратный.

Среднее квадратическое отклонение

Средним квадратическим отклонением s называется корень квадратный из суммы квадратов отклонений всех вариантов от среднего значения, деленной на объем, или корень квадратный из дисперсии:

или

Если вернуться к примерам 10.17 и 10.18, то там средние квадратические отклонения будут соответственно равны и

Среднее квадратическое отклонение, как и дисперсия, не обладают недостатком среднего абсолютного отклонения и коэффициента неровноты Н: они лучше реагируют на отдельные значительные отклонения при большом числе малых отклонений. Объясняется это тем, что квадраты больших отклонений становятся значительно больше квадратов малых отклонений по сравнению с первыми их степенями. Поэтому при отыскании среднего квадрата отклонений роль больших отклонений значительно увеличивается по сравнению с малыми.

Пример 10.19. Найти среднее квадратическое отклонение 100 вариантов, из которых 99 имеют абсолютные отклонения, равные 0,1, и лишь один вариант имеет абсолютное отклонение, равное 2.

Сравнивая полученное значение s со средним абсолютным (неровнота) получилась в два раза большей, т. е. одиночное большое отклонение повлияло на общее среднее квадратическое отклонение в два раза больше, чем на среднее абсолютное отклонение.

Среднее квадратическое отклонение имеет и недостатки.

Во-первых, оно является именованной величиной, а при сравнении рассеяния одной и той же статистической совокупности объектов по двум различным признакам это создает неудобство. Например, если имеется совокупность волокон хлопка, то интересно бывает сравнить неровноту распределения волокон по длине и по весу. Но среднее квадратическое отклонение длины будет выражено в миллиметрах, а весов – в миллиграммах, в связи с чем сравнить их не представляется возможным.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30