Партнерка на США и Канаду по недвижимости, выплаты в крипто
- 30% recurring commission
- Выплаты в USDT
- Вывод каждую неделю
- Комиссия до 5 лет за каждого referral
Таблица 3.8
Рабочая таблица расчета средней успеваемости
Успеваемость (баллы) | Частота | Середина интервала | Произведение |
До 3,5 | 53 | 3,25 | 172,25 |
3,5 – 4 | 100 | 3,75 | 375 |
4 – 4,5 | 56 | 4,25 | 238 |
4,5 – 5 | 74 | 4,75 | 351,5 |
Всего | 283 | 4,02 | 1136,75 |
Разделив полученную сумму на 283 (общее число опрошенных), мы получим средний балл успеваемости в 4,02. Таким образом, формула для средневзвешенного выглядит также, как и формула для вычисления простой среднеарифметической, однако Хi в ней относится к середине интервала.
Итак, средняя арифметическая и средневзвешенная дают нам возможность увидеть центральное распределение признака в исследуемой совокупности. Что касается дисперсии, то напомним, что дисперсия означает дословно «разбрасывание, рассеяние». В данном случае – это рассеяние реально полученных данных вокруг среднего значения. В зависимости от того, насколько велика (или мала) дисперсия, либо вычисленное с помощью ее среднеквадратичное отклонение, мы можем судить, насколько единодушны были респонденты в своих оценках (при меньшем значении дисперсии), или наоборот – насколько сильно они расходятся в своих мнениях (при большем значении дисперсии).
Раздел 4. ВЫЯВЛЕНИЕ СВЯЗЕЙ МЕЖДУ
ПЕРЕМЕННЫМИ
Тема 1. Табличное представление данных
Таблицы и графики в аналитическом отчете служат не просто иллюстративными материалами, а содержат в себе саму суть, ядро полученной в ходе исследования информации, так как без них просто невозможно выразить в чисто словесной форме выводы исследования. В этом параграфе речь пойдет как о технике составления и обработки, редактирования таблиц и, так и о некоторых областях их применения.
Все группировки значений различных переменных, предусмотренные программой исследования, ложатся в основу статистических таблиц, которые обобщают обработанную первичную социологическую информацию. Таблица — это перечень сведений, обычно числовых данных, приведенных в определенную систему и разнесенных по графам — строкам и столбцам. Строго говоря, процедура составления таблиц не представляет собою какой-то особой математической операции. Это скорее определенная форма отображения рядов распределений, полученных в результате расчетов. Основное преимущество этой формы заключается в том, что в ней кратко и емко даются пояснения значений соответствующих группировок. Хорошо сконструированная таблица позволяет более четко представить, описать и объяснить смысл и сущность изучаемого социального явления.
Построение таблицы производится по определенным правилам. Любая социологическая статистическая таблица описывается с помощью следующих параметров.
Заголовок — название таблицы, которое раскрывает структуру группировки описываемых переменных, либо характер связи (зависимости) между двумя и более переменными. Наряду с этим в названии (или чаще в подзаголовке) иногда указываются общие для всех переменных единицы измерения (число ответов, проценты, средний балл и т. д.).
Подлежащее — то, что подлежит описанию, то есть указание переменной, подвергаемой анализу, и тех конкретных значений, которые она может принимать.
Сказуемое — само описание, то есть числовые значения, разнесенные по графам — ячейкам или клеткам таблицы.
Таблицы бывают простые (линейные), групповые и комбинационные.
Простые таблицы представляют собою простой перечень (список) отдельных значений той или иной переменной с количественной или качественной характеристикой каждой из них в отдельности. Поэтому иногда их называют также перечневыми. Примером простой таблицы могут служить одномерные распределения опрашиваемой совокупности по полу респондентов, по их возрасту или курсу обучения (см. напр. табл. 3.2).
Что касается групповых таблиц, то они обычно содержат группировку единиц совокупности по одному признаку, а комбинационные — по двум и более признакам. Такие таблицы являют собою нечто большее, нежели простой перечень данных. Это одновременно и способ, и вместе с тем результат определенной систематизации данных. В комбинационных таблицах, чтобы избежать излишнего нагромождения данных, затрудняющего их восприятие, иногда опускают абсолютные величины (частоты) тех или иных значений переменных, оставляя лишь пропорции или проценты. Примером комбинационной разработки статистической таблицы может служить, например, таблица 4.1.
Таблица 4.1
Динамика изменения успеваемости по факультетам.
(в % к числу опрошенных)
Средний балл | ФАИТ | ХТФ | Всего по выборке | ||||||
Средний балл аттестата | Средний балл на момент исследования | Изменения +/- | Средний балл аттестата | Средний балл на момент исследования | Изменения +/- | Средний балл аттестата | Средний балл на момент исследования. | Изменения +/- | |
До 3,5 | 5,0 | 22,0 | +17,0 | 2,8 | 13,9 | +11,1 | 4,2 | 18,9 | +14,7 |
3,5-4 | 28,0 | 37,3 | +9,3 | 13,9 | 45,8 | +31,9 | 22,6 | 40,5 | +17,9 |
4-4,5 | 33,0 | 17,8 | -15,2 | 44,4 | 18,0 | -26,4 | 37,4 | 17,9 | -19,5 |
4,5-5 | 34,0 | 22,9 | -11,1 | 38,9 | 22,3 | -16,6 | 35,8 | 22,7 | -13,1 |
Итого | 100,0 | 100,0 | - | 100,0 | 100,0 | - | 100,0 | 100,0 | - |
Такая таблица являет собою уже нечто большее, нежели простой перечень данных. Она, с одной стороны, является как способом, так и результатом определенной организации, систематизации данных, а с другой — может стать удобным инструментом для анализа связей между сразу тремя переменными — факультетом, уровнем довузовской подготовки и успеваемостью на момент исследования. Хорошо сконструированная таблица позволяет исследователю более четко представить и описать смысл и сущность изучаемого им социального явления.
Прежде чем перейти к методическим рекомендациям по созданию и редактированию таблиц, следует отметить некоторые важные моменты, связанные с их конструированием. Прежде всего, следует отметить, что наиболее рациональным было бы продумать конструкцию таблиц еще на стадии разработки методического раздела программы социологического исследования, а именно той его части, которая называется «Логическая схема обработки и анализа данных». В этой части фактически и задается конструкция и формат таблиц. Обычно не возникает особых сложностей с конструкцией таблиц простых (линейных) распределений. Что же касается комбинационных таблиц, то здесь необходимо учитывать некоторые методические рекомендации, исходя из практического опыта проведения исследований.
Большинство комбинационных таблиц при расчетах формируется в ходе операции, именуемой кросстабуляция. Получаемые в результате кросстабы должны быть, как и любые другие таблицы, наглядны, обозримы и, по возможности, размещаться в пределах одной страницы. Поэтому первая рекомендация состоит в следующем. Поскольку ориентация текста на странице в абсолютном большинстве случаев бывает «книжная», а не «альбомная» (то есть страница больше по высоте, чем по ширине), нужно обращать внимание на соотношение числа значений (вариантов) тех переменных, связь между которыми будет отражена в кросстабе. При этом целесообразно руководствоваться простым правилом: ту переменную, которая имеет больше возможных значений, лучше размещать по строкам, а ту, у которой значений меньше,— по столбцам.
Вообще характер размещения переменных по строкам или по столбцам особо принципиального значения не имеет, однако такой вариант предпочтительнее в силу своей компактности и лучшей обозримости. Хотя, конечно, во многом здесь дело вкуса, и преимущества предлагаемого варианта становятся более очевидны, когда одна из переменных имеет достаточно большое число возможных значений. Однако для дальнейшего анализа необходимо принять во внимание еще одно правило: внимательно отслеживайте, где вы размещаете независимую переменную — по строкам или по столбцам, и, соответственно этому, при обработке массива данных задавайте команду на расчет процентов в кросстабе.
Аналогично производится составление и редактирование таблиц в тех случаях, когда мы производим расчет не в процентах, а в средних значениях баллов тех или иных оценок.
Иногда в аналитических целях возникает необходимость ранжировать полученные частоты и проценты с тем, чтобы сразу расставить приоритеты. Так, в нашем исследовании респондентам был задан вопрос относительно их оценки причин, мешающих повышению успеваемости. Этот вопрос был представлен в анкете в виде веера ответов и выглядел довольно хаотичным, чтобы подчеркнуть ценностный нейтралитет авторов анкеты, кодировка же — с 18 по 24 - просто определяет их порядок.
В данном случае необходимо заготовить шаблон пустой таблицы и последовательно, раз за разом, перенести в ее ячейки все полученные значения. Теперь отразим полученную в результате расчетов таблицу, в которой расставим процент ответов, полученный каждым из этих значений в ходе опроса; при этом мы пока сохраняем тот порядок следования, который был принят в анкете (см. табл. 4.2).
Таблица 4.2
Причины, мешающие повышению успеваемости
(в % к числу ответов)
Что вам мешает учиться лучше? | В целом по выборке |
18. Нет особого интереса в получении знаний | 13,1 |
19. Многие предметы считаю бесполезными для будущей профессии | 24,0 |
20. Недостаточная довузовская подготовка | 9,4 |
21. Плохие бытовые условия для занятий | 7,2 |
22. Трудно заставить себя заниматься | 29,3 |
23. Неважная организация учебного процесса | 7,8 |
24. Разочарование в профессии, которую получаю | 9,2 |
ИТОГО | 100,0 |
В этой таблице мы выделили полужирным шрифтом модальное значение переменной — так оно сразу бросается в глаза. Однако для удобства более детального анализа можно применить и другой прием – проранжировать данные в таблице, то есть разместить их в порядке убывания от самого частого – того значения переменной, которое получило наибольшее число ответов, до наименее частого — того, которое получило наименьшее число голосов. В результате мы получим несколько иную таблицу (см. табл. 4.2а), из данных которой мы сразу сможем сделать вывод о том, как оценивают опрошенные причины, мешающие повышению успеваемости. Здесь уже нет необходимости выделять модальные или, наоборот, самые низкие значения переменных — они окажутся на самом верху или в самом низу.
Из данных этой таблицы уже совсем не представляет труда рассмотреть, какие причины являются наиболее существенными и оказывают значимое влияние на успеваемость студентов. Отсюда видно, что иногда составление и редактирование таблиц нельзя назвать чисто механической операцией. Такая процедура может значительно облегчить анализ полученных данных.
Таблица 4.2а
Причины, мешающие повышению успеваемости
(в % к числу ответивших)
Что вам мешает учиться лучше? | В целом по выборке |
18. Трудно заставить себя заниматься | 29,3 |
19. Многие предметы считаю бесполезными для будущей профессии | 24,0 |
20. Нет особого интереса в получении знаний | 13,1 |
21. Недостаточная довузовская подготовка | 9,4 |
22. Разочарование в профессии, которую получаю | 9,2 |
23. Неважная организация учебного процесса | 7,8 |
24. Плохие бытовые условия для занятий | 7,2 |
ИТОГО | 100,0 |
Тема 2. Анализ двумерных распределений
Одной из важнейших задач любого анализа данных является проверка гипотез, сформулированных в программе исследования, то есть предположений о наличии связи между двумя и более переменными. И на определенном этапе анализа необходимо заняться поиском таких связей. Чтобы проделать это, надо найти ответ на пять основных вопросов:
1. Существует ли в реальности обозначенная в гипотезе связь между независимой и зависимой переменными?
2. Каково направление этой связи?
3. Насколько сильна связь?
4. Является ли связь статистически значимой?
5. Является ли связь каузальной?
Прежде всего, необходимо ответить на первый вопрос. Мы можем утверждать, что связь существует, если значения, которые мы наблюдаем для независимой переменной, ассоциируются со значениями, наблюдаемыми для зависимой переменной. Воспользуемся нашим примером. Мы сформулировали гипотезу о том, что существует связь между трудовой занятостью студента очного отделения и его успехами в учебе. При анкетировании был задан прямой вопрос с предлагаемыми вариантами ответов.
Каковы ваши успехи в учебе? Отметьте средний балл по результатам сессий за прошлый год.
1 - до 3,5 баллов
2 – 3,5 – 4 балла
3 – 4 – 4,5 балла
4 – 4,5 - 5 баллов
При обработке данных опроса нам для проверки гипотезы необходимо сопоставить значения независимой переменной (трудовая занятость) с соответствующими значениями зависимой переменной (успехи в учебе). С целью такого сопоставления мы после соответствующей обработки данных составляем таблицу 4.3.
Таблица 4.3
Успеваемость работающих и не работающих студентов.
Средний балл на момент опроса | Совмещаете ли вы учебу с работой? | Всего | |
да | нет | ||
До 3,5 | 22 | 32 | 54 |
% по строке | 40,7 | 59,3 | 100,0 |
% по столбцу | 18,6 | 19,4 | 19,1 |
3,5 – 4 | 47 | 50 | 97 |
% по строке | 48,5 | 51,5 | 100,0 |
% по столбцу | 39,8 | 30,3 | 34,3 |
4 – 4,5 | 21 | 36 | 57 |
% по строке | 36,8 | 63,2 | 100,0 |
% по столбцу | 17,8 | 21,8 | 20,1 |
4,5 – 5 | 28 | 47 | 75 |
% по строке | 37,3 | 62,7 | 100,0 |
% по столбцу | 23,8 | 28,5 | 26,5 |
Всего | 118 | 165 | 283 |
% | 41,7 | 58,3 | 100,0 |
Такая таблица называется «кросстаб», а процесс ее создания – «кросстабуляция». Это один из основных способов анализа, используемых для того, чтобы увидеть, какую связь переменные имеют друг с другом. Категории независимой и зависимой переменной в принципе могут размещаться как по строкам, так и по столбцам (графам) кросстаба. Обычно независимую переменную помещают в верхней части кросстаба, формируя, таким образом, столбцы из значений зависимой переменной. Однако на практике из соображений удобства кросстаб чаще всего конструируют так, чтобы сверху вниз шла переменная с большим числом категорий. Реально, конечно не имеет значения, как будет сконструирован кросстаб: имея независимую переменную в верней части таблицы (по горизонтали) или сверху вниз (по вертикали). Главное – соблюсти правило: когда выбор сделан, процентные отношения в таблице должны вычисляться таким образом, чтобы проверить наличие связи. Давайте на примере кросстаба 4.3 посмотрим, как производится чтение таблицы – процесс, в ходе которого и выявляется наличие или отсутствие связи между переменными и ее параметры.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 |


