Принципы построения статистических группировок и классификаций
Лекция №2
Принципы построения статистических группировок и классификаций
Приемы проведения статистических группировок весьма разнообразны и зависят от задач, которые в соответствие с поставленными целями исследования ставятся перед группировками.
Группировочный признак – признак, по которому проводится разбивка единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы, которые получают в результате статистического исследования. В основание группировки могут быть положены как количественные, так и качественные признаки, абсолютные и относительные значения. После определения группировочного признака следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп, в то время как построение групп по качественному признаку, как правило, зависит от имеющихся градаций, видов и других состояний объекта.
Классификация – систематизированное распределение явлений и объектов на определённые группы, классы разряды на основании их сходства и различия.
Отличительные черты классификации:
В основе классификации лежит качественный признак Классификация стандартна для всех областей применения Классификация устойчиваЕсли в каждом конкретном исследовании строится своя группировка, то классификация едина для любого исследования. Классификации устойчивы в течение продолжительного времени и дополняются при необходимости. По сути, классификация является основой для группировок, точно определяя возможные групп, указатели, которые помогают отнести любую единицу объекта в ту или иную группу в каждом конкретном случае.
В случае, если группировка проводится по количественному признаку, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, т. к. группы будут малочисленными и не смогут предоставлять адекватную характеристику исследуемого явления.
Слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических процессов и явлений.
Формула Герберта Стерджесса (1926 г.) для определения оптимального числа групп:

Согласно Стерджессу, выбор числа групп зависит от объема совокупности. Недостаток формулы состоит в том, что её применение дает хорошие результаты лишь при большой совокупности, а распределение еиниц признака близко к нормальному распределению.
После определения числа групп следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границых. Каждый интервал имеет свою величину, верхнюю и нижнюю границы. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нём. Величина интервала – разность между верхней и нижней границами интервала. Интервалы группировки, в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, убывающие, специализированные и т. д.
Величина равного интервала:
![]()
![]()
Полученную величину округляют.
Правила округления
Исходное число | Округление | Пример |
Один знак до запятой | До десятых | 0.66 = 0.7 0.372 = 1.4 5.8 = 5.8 |
Два знака до запятой | До целого числа | 12.748 = 13 |
Трехзначное число | До ближайшего числа, кратного 50 | 248 = 250 |
Открытые интервалы – интервалы, у которых указана только одна граница. Закрытые интервалы – интервалы, которых обозначено две границы. При этом, верхняя граница i-го интервала является нижней границей i+1-го интервала.
Ряд распределения – упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку. В зависимости от признака различают атрибутивный и вариационный ряды распределения.
Атрибутивный ряд распределения – ряд, построенный по качественным признакам. Например:

Элементами атрибутивного ряда являются значения атрибутивного признака, представленного названиями, видами, формами и пр. признаками. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.
Вариационный ряд распределения – ряд, построенный по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Варианты – отдельные (конкретные) значения признака, которые он принимает в вариационном ряду. Частоты – численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объем. Частности – частоты, выраженные в долях единицы или в процентах к итогу. Соответственно, сумма частностей равна 1 или 100%
Вариация количественных признаков может быть дискретной и непрерывной. В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку. Примером такого ряда может служит распределения семей по числу комнат в квартирах, и т. д.

Графически ряд распределения удобно изображать в виде гистограммы распределения. Гистограмма используется для изображения интервального вариационного ряда.
Для графического изображения вариационного ряда также служит кумулятивная кривая – кумулята. Кумулята показывает, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение. Кумулята определяется путём последовательного суммирования частот по группам.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получим огиву





