2.6. Таблицы и графики

Результаты непосредственного сбора информации, а также сводки или группировки могут быть представлены в виде текста, таблиц, или отображены графически. Текстом более 3-5 чисел воспринимаются с трудом, поэтому основным способом представления статистических данных являются таблицы. Таблица - наиболее компактный и удобный способ представления статистической информации, прежде всего, результатов сводки, применяемый, как и группировка, на всех последующих этапах анализа информации. Но в отличие от результатов группировки, таблицы могут представлять собой более сложные образования, и содержать информацию не только данных сводки (систематизированные данные и возможные итоги), не только результаты одной группировки, но и всевозможные их комбинации, перечни, рассчитанные из исходных величин, а также, временные ряды показателей, и т. д. Примеры любой сложности таблиц можно найти в каждом сборнике Росстата. Необходимо иметь в виду, что целью построения таких таблиц является в максимально компактной форме предоставить как можно больше информации, полученной на этапе сбора, необходимой для ее пользователей. Первая цель построения таблиц для любого исследователя, самостоятельно проводившего сбор информации, будет аналогичной: после введения информации на электронные носители он получает электронные таблицы исходных данных. Но эти таблицы – вспомогательные, рабочие. Если же исследователь решает привести какие-либо данные в своей работе, то кроме распечатки самой сетки таблицы, состоящей из системы столбцов и строк, включающих упорядоченные хотя бы по одному признаку значения единиц совокупности и частоты, и (или) значения расчетных показателей, то ему необходимо эту таблицу еще и статистически грамотно оформить.

НЕ нашли? Не то? Что вы ищете?

Любая таблица включает строки и столбцы (колонки), на пересечении которых находятся графы. Иногда строки для удобства нумеруют, а столбцы обозначают различными буквами. В верхней части каждого столбца пишут полностью (без сокращений), что в нем представлено и в каких единицах измерения или соотношения. Тем самым величины показателей, представляемые в графах таблиц, остаются в чистом виде – в виде чисел. Обычно в научных статьях для таблиц используется 12-й шрифт с единичным интервалом, если в основном тексте шрифт 14-ый и полуторный интервал.

Если во всей таблице показатели измеряются в одних и тех же единицах измерения или соотношения, то комментарий о них можно для краткости вынести поверх таблицы. Итоговая (суммарная, сводная) строка или столбец могут быть как первыми, так и последними в таблице. Каждая строка может содержать комментарий (либо название единицы совокупности), который обычно находится слева. Таблица обязательно должна иметь название, характеризующее ее содержание, а также привязку таблицы к месту и времени.

Название таблицы должно быть максимально кратким и, в то же время, ёмким. Если в статье или тексте несколько таблиц, то все они должны быть пронумерованы. Если таблица заимствована, то снизу пишется источник, откуда она взята или на основе каких данных рассчитана. Макет таблицы представлен ниже (см. таблица 2 стр.63).

Основные правила заполнения таблиц.

1. Все значения одного признака должны быть одной разрядности.

Например: 8,221 7,550 4,300 9,000 , а не 8,221 7,55 4,3 9.

Таблица 2.

ОБЩИЙ ЗАГОЛОВОК*

Заголовки

ИТОГО

A

В

C

D

Перечень

(группы)

единиц

совокупности

1

2

3

4

ИТОГО

5

*Сноска на источник.

2. В российских справочниках для выделения дробной части все реже используется точка: 8.221. Росстат перешел в последнее время на европейские обозначения, где используется запятая: 8,221. Все последние версии ПСП воспринимают только запятые.

3. «--» явление отсутствует.

4. « . . . » - данных не имеется.

5. «0.000» - значение меньше единицы измерения. Здесь меньше 0,0005 .

6. «Х» - данная клетка не имеет смысла (не подлежит заполнению).

Из-за округления промежуточных данных иногда суммы по столбцам или по строкам не сходятся с итогами, рассчитанными отдельно, или равными 100%. В таблице есть две части признаков: одна часть – «характеризуемое», то, что характеризуется в данной таблице, и «характеризующее», - то, чем характеризуется первая часть. Классификация таблиц схожа с классификацией группировок, с тем лишь различием, что в одну рабочую таблицу можно поместить сразу и несколько группировок, и динамику, и индексы, и т. п. Необходимо помнить, что таблицы, которые исследователь приводит в отчете для демонстрации, должны быть максимально простыми и понятными, без лишних показателей и нагромождений.

Графики.

Графики - условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков и географических карт-схем. Графики используются: 1) для предварительного визуального анализа исходных статистических данных на этапах предварительного и описательного анализа; 2) для наглядности отображения результатов расчетов на любом этапе статистического исследования, в том числе для структурного анализа, анализа связей, сравнительного анализа во времени или в пространстве. Графики, в отличие от табличного представления информации, источниками таковой не являются, так как изображение на них данных носит условный, округленный, приблизительный характер, несмотря на то, что некоторые из них и сопровождаются точными пояснениями изображенных значений.

Графики в статистике называются различно в зависимости, оттого что и как они отображают. Частоты изображают в виде полигонов, гистограмм, и т. п. Диаграммы показывают различные значения признаков, а также их структурные соотношения. Они могут строиться по одному признаку или одновременно по нескольким сравниваемым между собой. Диаграммы могут быть различных видов, их перечень представлен в любой ПСП, и разобраться в принципе их построения не представляет большого труда. Наиболее полный обзор видов графиков можно прочитать в электронном учебнике Statistica StatSoft [16] в разделе «Графические методы анализа данных. Краткий обзор типов графиков».

Оформление графиков схоже с оформлением таблиц: график всегда сопровождается заголовком, который может находиться как над, так и под полем графика. В нем указывается – как и в общем заголовке таблицы, что изображено (что и чем характеризуется), в каких единицах измерения, привязка к совокупности, пространству и времени. В отличие от таблиц усложнение графиков ограничено возможностями человека воспринимать наглядную информацию. При чтении графиков в научной литературе необходимо обращать внимание на масштаб и единицы измерений отображаемых значений, в противном случае можно ошибиться в выводах. Специальные статистические графики будут разъяснены в соответствующих разделах анализа данного пособия. Таблицы и графики в научных статьях должны быть максимально понятными и простыми. Усложнение и нагромождение в них ведет лишь к одному выводу - их не воспринимаемости и, следовательно, бесполезности.

Глава 3. Описательная статистика.

3.1 Показатели структуры.

Анализ любой совокупности начинается с изучения соотношений частот значений отдельных признаков. Необходимо отметить что, если значения признака представлены в относительной шкале измерения, то иногда также возможен расчет суммарного значения признака, - как для всей совокупности, так и для отдельных ее групп. Например, признак «товарооборот» для отдельных единиц совокупности - предприятий, имеет суммарное значение, показывающее общий товарооборот для всех этих предприятий. Если в данной совокупности, предположим, проведена группировка по формам собственности, то возможен расчет общего товарооборота для каждой из выделенных форм собственности.

В большинстве же случаев расчет суммарного значения признака либо не имеет смысла (хотя, как будет показано в дальнейшем, является промежуточной операцией для расчета средней величины), либо не возможен вообще в случае с номинальными и порядковыми шкалами измерений. Поэтому первый простейший анализ проводят с частотами, соответствующими отдельным значениям или группам, представленным в любых шкалах измерений, - через их соотношения с общей численностью совокупности или между собой. Данные соотношения принято называть показателями структуры и координации соответственно. Когда цель исследования – изучить структуру совокупности по определенным признакам, - этим анализом может ограничиваться вся аналитическая работа.

Например, имеем статистическую совокупность «Избиратели участка № N…» общей численностью 1000 человек. Данную совокупность делим на группы по признакам, выраженным в различных шкалах:

1) Номинальная шкала: пол мужской - 400 человек, женский - 600 человек.

Показатели структуры:

«% мужчин в общей численности избирателей …» - [400/1000] * 100=40%

«% женщин в общей численности избирателей …» - [600/1000]* 100=60%

Итого: 100%

Показатель координации:

«соотношение женщин к мужчинам среди избирателей…» =[600/400]=3/2, т. е. на трех женщин приходится двое мужчин в общей численности избирателей...

Обычно показатели координации переводят в целые числа для наглядности. Так, соотношение полов при рождении дают в виде пропорции 105-106 мальчиков на 100 девочек. При построении показателей координации за базу сравнения обычно берется меньшая величина из двух сравниваемых.

2) Порядковая позиционная шкала: Ответы на вопрос «Считаете ли Вы, что графу в бюллетенях по голосованию «Против всех» необходимо убрать?» распределились среди избирателей участка № N… следующим образом:

П 1. Да, считаю - 100 человек

П 2. Скорее да, чем нет - 150 человек

П 3. Затрудняюсь ответить - 200 человек

П 4. Скорее нет, чем да - 350 человек

П 5. Нет, не считаю - 200 человек

Итого - 1000 человек.

Показатели структуры:

«% лиц, проголосовавших по позициям»:

П 1. Да, считаю [100/1000]*100=10%

П 2. Скорее да, чем нет [150/1000]*100=15%

П 3. Затрудняюсь ответить[200/1000]*100=20%

П 4. Скорее нет, чем да [350/1000]*100=35%

П 5. Нет, не считаю [200/1000]*100=20%

ИТОГО 100%.

В статистике доли отдельных частот в общей численности называют частостями.

Показатели координации:

Соотношение численности тех, кто категорически нет, к тем, кто однозначно да: (п5/п1): 200/100=2 к 1 .

Соотношение численности тех, кто «скорее нет, чем да» к тем, кто «скорее да, чем нет»: (п4/п2):350/150=7 к 3 , или первых больше вторых примерно в 2,3 раза.

Для позиционных порядковых и для относительных шкал возможен расчет так называемых накопленных (синоним - кумулятивных) частот и соответствующих им долей - накопленных частостей:

В данном примере возможен расчет количества избирателей, которые на данный вопрос ответили в целом отрицательно (п4+п5): 350+200= 550 человек,

или в целом положительно: (п1+п2): 100+150=250 человек. Также возможен расчет количества лиц, категорически не возражающих против того, чтобы данную графу убрали: их можно подсчитать двумя путями:

Первым: сложить (п1+п2+п4): 100+150+350 = 600 человек.

И вторым: добавить к (100+150+350) еще и 200 человек сомневающихся (п3), раз они явно не против: 600+200= 800 человек. Какой путь выбрать – решается в зависимости от постановки вопроса и вариантов ответов-подсказов.

Частости по накопленным частотам рассчитываются аналогично показателям структуры:

[550/1000]*100=55% - от общей численности избирателей… составляют те, кто не считает, что графу в бюллетенях по голосованию «Против всех» необходимо убрать.

[250/1000]*100=25% - от общей численности избирателей составляют те, кто в той или иной форме считает, что графу в бюллетенях по голосованию «Против всех» необходимо убрать.

[800/1000]*100=80 % - от общей численности избирателей составляют те, кто категорически не возражает против того, чтобы графу в бюллетенях по голосованию «Против всех» убрали.

Аналогично рассчитываются и показатели координации для частостей:

Например, соотношение тех, кто категорически не возражает к тем, кто «строго нет»: 800/200=4 к 1 , т. е. на каждых четырех категорически не возражающих приходится лишь один категорически возражающий.

При интерпретации результатов выбирается наиболее понятный и убедительный из всех возможных. Чем проще и доступней для восприятия числа «на выходе» - тем больше шансов, что Вас поймут.

3) Относительная шкала. Предположим, что избиратели участка № N… согласились ответить на вопрос о своих доходах за последний месяц.

Вопрос мог быть поставлен так: Какова величина Вашего дохода за последний месяц (в тыс. рублей)?

Получилась следующая картина ответов: 1) Иванова - 25 тысяч рублей, 2) Петрова - 10 тысяч рублей, 3) Сидорова – 30 тысяч рублей, 4) Семенова - 12 тысяч рублей, ... , 998) Куроедов – 26 тысяч рублей, 999) Мясоедов - 30 тысяч рублей, 1000) Рыбоедов - 20 тысяч рублей.

В этом случае для сжатия информации пришлось бы провести группировку по величине дохода. Предположим, решили выделить пять групп. Результаты группировки изобразим в виде таблицы (см. таблица 3).

Таблица 3.

Распределение избирателей участка № N…

по уровню дохода за 20.. год.

Уровень доходов на человека

( в тыс. рублей)

Количество

(человек), fj

Доля в общей численности

( в % ), wj

Доля лиц, доход которых не превышает данный по строке, (в %).

A

B

C

D

1.

До 10

95

9,5

9,5

2.

10 - 19

255

25,5

35,0 [=9,5+25,5]

3.

20 – 29

400

40,0*

75,0 [=35,0+40,0]

4.

30 – 39

200

20,0

95,0 [=75,0+20,0]

5.

40 и более

50

5,0

100,0 [=95,0+5,0]

6.

ИТОГО

1000

100,0

Х**

*Обратите внимание на разрядность в данном столбце!

** Заполнение данной графы лишено смысла - ставим «Х».

В столбце A имеем пять групп по уровню дохода, в столбце B - частоты, в столбце С – «частости», или доли в общей численности каждой из частот, рассчитываемые по формуле:

wj = fj / å fj

где j – номер группы, j= 1,k k - общее количество групп.

В столбце D располагаются накопленные частости, показывающие какой процент лиц имеет доход не выше указанного в каждой строке, например, в строке №3 столбца D - 75,0% - означает, что доход по 29 тысяч рублей (или до 30 тысяч рублей) имеют 75% опрошенных.

Аналогично можно рассчитать и частость в обратном порядке. Тогда она будет показывать доход не ниже указанного по строке (см. таблицу 5).

К примеру, в строке 2. в столбце Е - 90,5% - доля лиц, доход которых не ниже 10 тысяч рублей (от 10 тысяч рублей и более).

Таблица 5.

Структура совокупности «…» по уровню доходов.

Уровень доходов на человека (в тыс. рублей)

Доля в общей численности

(в %)

Доля лиц, доход которых не ниже данного по строке ( в %).

 

A

C

E

До 10

9,5

100,0 [=90,5+9,5]

10 - 19

25,5

90,5 [=65,0+25,5]

20 – 29

40,0

65,0 [=25,0+40,0]

30 – 39

20,0

25,0 [=5,0+20,0]

40 и более

5,0

5,0

ИТОГО

100,0

Х

Показатели координации, рассчитываемые по величинам, измеренным в относительной шкале, - еще более разнообразны, чем рассчитываемые по измеренным в порядковой позиционной шкале. Для них можно сравнивать через деление частоты и частости любых групп и накопленные частоты и частости, рассчитанные как по возрастанию, так и по убыванию номеров групп.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8