Рис. 2.3 Кривая накопленных частот вариационного ряда.
Аналитическое исследование вариационного ряда состоит в том, что вычисляют статистические характеристики (статистики) выборочного распределения. Эти статистики аналогичны параметрам теоретического распределения. Они позволяют сравнивать между собой выборки, геологические объекты в целом, подбирать теоретический закон распределения к выборочным данным. На решении всех этих задач мы остановимся ниже. А пока перечислим основные статистики.
Cреднее значение характеризует собой центр распределения, вокруг которого группируется основная масса данных. Оно является практическим аналогом математического ожидания для теоретического закона распределения.
Среднее арифметическое значение вычисляется по формуле:
(2.4)
xi - отдельные значения признака в выборке;
N - объем выборки;
- среднее значение
Для сгруппированного вариационного ряда рассчитывается средневзвешенное среднее значение показателя:
(2.5)
xi - середина i-го частичного интервала;
ni - частота i-го интервала;
k - количество частичных интервалов;
N - объем выборки;
Выборочная дисперсия, также как и теоретическая дисперсия, является мерой изменчивости признака и вычисляется по формуле:
(2.6)
Условные обозначения см. формулу (2.4)
Либо для сгруппированного вариационного ряда:
(2.7)
Условные обозначения см. формулу (2.5).
Очень часто в статистике в качестве меры изменчивости признака используют среднее квадратическое отклонение (стандарт), вычисляемое как корень квадратный из дисперсии. Эта статистика, в отличие от дисперсии, характеризует изменчивость не в квадратных, а в истинных значениях признака:
(2.8)
Kоэффициент вариации позволяет сопоставлять изменчивость признаков, различных по размерности и масштабам, и вычисляется по формуле:
(2.9)
S - среднеквадратическое отклонение;
- среднее значение;
V - коэффициент вариации.
Показатель асимметрии является мерой скошенности ряда влево или вправо от среднего значения и вычисляется по формуле:
(2.10)
Показатель эксцесса служит мерой крутизны кривой распределения и вычисляется по формуле:
(2.11)
Часто в практике обработки данных используют такие показатели как медиана и мода, которые могут служить приближенной оценкой среднего значения.
Медианой (Me) ряда распределения называют то значение показателя, которое делит вариационный ряд на две равные по численности части. Если ряд не сгруппирован по частичным интервалам, то при нечетном количестве данных медиана определяется следующим образом:
(2.12)
при четном количестве данных:
(2.13)
где
;
- номера элементов выборки.
Если ряд сгруппирован, то медиану вычисляют по формуле:
(2.14)
где xm - начальное значение показателя в частичном интервале, содержащем медиану;
h - ширина частичного интервала;
Nm - накопленная частота интервала с медианным значением;
nm - частота медианного интервала; N - объем выборки.
Модой (Mo) вариационного ряда называется то значение показателя, которому соответствует наибольшая частота. В сгруппированном по частичным интервалам вариационном ряду определяют модальный интервал, а затем уточняют значение моды по формуле:
(2.15)
где xm - начальное значение признака в модальном интервале;
nm-1, nm, nm+1 - частоты домодального, модального и послемодального интервалов;
Для симметричных распределений (нормальный закон) значение моды, медианы и среднего значения совпадают.
Пример 1. Рассмотрим последовательность составления и исследование вариационного ряда по результатам анализа 100 проб гранитов на один из элементов (табл. 2.3):
Таблица 2.3
0,60 | 3,91 | 5,83 | 3,86 | 3,39 | 6,83 | 2,62 | 3,20 | 4,82 | 6,61 |
6,31 | 6,17 | 4,89 | 4,98 | 2,27 | 5,37 | 4,67 | 5,64 | 4,88 | 2,59 |
3,18 | 3,12 | 4,11 | 5,64 | 4,21 | 3,00 | 3,25 | 4,38 | 6,42 | 5,40 |
5,00 | 6,00 | 8,40 | 2,11 | 4,74 | 4,51 | 1,61 | 5,78 | 2,91 | 7,27 |
5,86 | 2,18 | 2,50 | 4,32 | 3,71 | 5,24 | 5,43 | 2,81 | 5,67 | 3,93 |
3,31 | 5,95 | 4,54 | 6,00 | 3,58 | 4,27 | 4,41 | 4,40 | 5,55 | 3,71 |
5,90 | 4,56 | 5,91 | 5,61 | 4,59 | 4,33 | 1,91 | 6,00 | 3,99 | 4,44 |
4,69 | 3,73 | 3,73 | 4,13 | 4,66 | 4,76 | 6,42 | 5,00 | 4,36 | 4,00 |
4,14 | 4,89 | 2,72 | 7,91 | 3,41 | 3,65 | 4,47 | 3,34 | 5,14 | 4,00 |
7,00 | 4,34 | 5,91 | 3,44 | 4,34 | 5,24 | 1,11 | 4,85 | 5,32 | 2,41 |
Минимальное содержание изучаемого элемента равно 0,60; максимальное - 8,40%. Определим по формуле (2.1) длину интервала группировки
![]()
Число этих интервалов определяется знаменателем формулы (2.1) и в данном случае равно 9. Границы частичных интервалов можно выбрать такими:
0,0-1,0; 1,0-2,0; 2,0-3,0; 3,0-4,0; 4,0-5,0; 5,0-6,0; 6,0-7,0; 7,0-8,0; 8,0-9,0.
Следует помнить, что в интервал следует включать либо нижнюю, либо верхнюю границу частичного интервала. Иначе, одно и то же выборочное значение можно сосчитать дважды.
Условимся, что значения показателя в выборке, совпадающие с границами частичных интервалов, будем относить в интервал меньших значении. Теперь приступаем к разнесению данных по частичным интервалам. В результате получим следующий вариационный ряд:
Таблица 2.4
Середина интервала (xi) | 0,5 | 1,5 | 2,5 | 3,5 | 4,5 | 5,5 | 6,5 | 7,5 | 8,5 |
Частота (ni) | 1 | 3 | 11 | 21 | 31 | 23 | 7 | 2 | 1 |
После разнесения данных по классам необходимо выполнить проверку соответствия суммы частот с объемом выборки:
N = 1+3+11+21+31+23+7+2+1=100
Ряд накопленных частот для нашего примера имеет вид:
Таблица 2.5
xi | 0,5 | 1,5 | 2,5 | 3,5 | 4,5 | 5,5 | 6,5 | 7,5 | 8,5 |
ni | 1 | 4 | 15 | 36 | 67 | 90 | 97 | 99 | 100 |
Перейдем к графическому изображению ряда.
На рис. 2.1 показан полигон распределения вариационного ряда, построенный согласно данным табл. 2.4. По оси абсцисс отложены середины частичных интервалов, а по оси ординат - частоты. На рис. 2.2 показана гистограмма распределения того же вариационного ряда. По оси абсцисс отложены границы частичных интервалов, на которых затем построены прямоугольники, высотой, соответствующей частоте частичного интервала.
На рис. 2.3 показана кривая накопленных частот вариационного ряда, построенная в соответствии с данными табл. 2.5.
Теперь выполним аналитическое исследование вариационного ряда. Вычисление статистик удобно производить после заполнения таблицы такого вида:
Таблица 2.6
Интервал | xi | ni | xi ni |
|
|
|
|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
0,0-1,0 | 0,5 | 1 | 0,5 | -3,91 | 15,29 | -59,78 | 233,74 |
1,0-2,0 | 1,5 | 3 | 4,5 | -2,91 | 25,40 | -73,93 | 215,13 |
2,0-3,0 | 2,5 | 11 | 27,5 | -1,91 | 40,13 | -76,65 | 146,40 |
3,0-4,0 | 3,5 | 21 | 73,5 | -0,91 | 17,39 | -15,82 | 14,40 |
4,0-5,0 | 4,5 | 31 | 139,5 | 0,09 | 0,25 | 0,02 | 0,002 |
5,0-6,0 | 5,5 | 23 | 126,5 | 1,09 | 27,33 | 29,78 | 32,47 |
6,0-7,0 | 6,5 | 7 | 45,5 | 2,09 | 30,58 | 63,90 | 133,56 |
7,0-8,0 | 7,5 | 2 | 15,1 | 3,09 | 19,1 | 59,01 | 182,33 |
8,0-9,0 | 8,5 | 1 | 8,5 | 4,09 | 16,73 | 68,42 | 279,83 |
Сумма | 100 | 441,0 | 192,19 | -5,04 | 1237,84 |
По результатам суммирования колонок таблицы 2.6 получим следующие статистики:
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |


