На производство одного и того же количества товара определенного вида и качества разные производители (заводы, фирмы) затрачивают неодинаковое количество труда и материальных ресурсов. Но рынок осредняет эти затраты, и стоимость товара определяется средним расходом ресурсов на производство,
Погода в определенном пункте земного шара в один и тот же день в разные годы может быть очень различной. Например, в Санкт-Петербурге 31 марта температура воздуха за сто с лишним лет наблюдений колебалась от -20,1° в 1883 г. до +12,24° в 1920 г. Примерно такие же колебания наблюдаются и в другие дни года. По таким индивидуальным данным о погоде в какой-то произвольно взятый год нельзя составить представление о климате Санкт-Петербурга. Характеристики климата - это средние за длительный период характеристики погоды - температуры воздуха, его влажность, скорость ветра, сумма осадков, число часов солнечного сияния за неделю, месяц и весь год и т. д. Приведем еще один пример осреднения, его роли, в управлении важнейшими и опасными процессами, от которых зависит жизнь людей. Физика установила, что невозможно предсказать, когда произойдет распад ядра радиоактивного атома, например изотопа уран-235. Атом может распасться через секунду или через тысячу лет. Но в массе атомов (например, находящихся в стержнях реактора АЭС) точно можно измерить среднюю скорость распада (обычно используют показатель «время полураспада» - время, за которое распадается половина атомов). Вводя вещества-замедлители образующихся при распаде атомов урана частиц, или убирая их, можно управлять скоростью цепной реакции в урановых стержнях, регулировать мощность реактора, вводить ее в безопасные и экономически выгодные границы.
Если средняя величина обобщает качественно однородные значения признака, то она является типической характеристикой признака в данной совокупности. Так, можно говорить об измерении типичного роста русских девушек рождения 1973 г. по достижении ими 20-летнего возраста. Типичной характеристикой будет средняя величина надоя молока от коров черно-пестрой породы на первом году лактации при норме кормления 12,5 кормовой единицы в сутки. Для лиц с достаточно однородным уровнем дохода, например рабочих машиностроительной отрасли, пенсионеров по старости (исключая имеющих льготы), можно определить типичные доли расходов на покупку предметов питания в их бюджете.
Однако неправильно сводить роль средних величин только к характеристике типичных значений признаков в однородных по данному признаку совокупностях. На практике значительно чаще современная статистика использует средние величины, обобщающие явно неоднородные явления, как, например, урожайность всех зерновых культур по территории всей России, включая кукурузу, дающую по 50-60 ц/га и более, и гречиху, дающую 6-10 ц/га, и плодородные черноземы Кубани, и скудные почвы Архангельской области. Или рассмотрим такую среднюю, как среднее потребление мяса на душу населения: ведь среди этого населения и дети до одного года, вовсе не потребляющие мяса, и вегетарианцы, и северяне, и южане, шахтеры, спортсмены и пенсионеры. Еще более ясна нетипичность такого среднего показателя, как произведенный национальный доход в среднем на душу населения.
Средняя величина национального дохода на душу, средняя урожайность зерновых по всей стране, среднее потребление разных продуктов питания — это характеристики государства как единой народнохозяйственной системы, это так называемые системные средние.
Системные средние могут характеризовать как пространственные или объектные системы, существующие одномоментно (государство, отрасль, регион, планета Земля и т. п.), так и динамические системы, протяженные во времени (год, десятилетие, сезон и т. п.). Примером системной средней, характеризующей период времени, может служить средняя температура воздуха в Санкт-Петербурге за 1996 г., равная +5,19°С. Эта средняя величина обобщает и летние высокие температуры +20, +25°, и зимние морозы, осень и весну, дни и ночи.
С другой стороны, средняя температура воздуха за отдельный год не является типической характеристикой климата Санкт-Петербурга, потому что в разные годы средняя температура года значительно колеблется, например за последние 30 лет от +2,90° в 1976 г. до +7,44° в 1989 г. Типической характеристикой климата будет многолетняя средняя годовая температура за десятки лет, например за гг. она составила +5,05°.
Итак, типическая средняя может обобщать системные средние для однородной совокупности, или системная средняя может обобщать типические средние для единой, хотя и неоднородной, системы. При этом даже типическая средняя не является раз и навсегда данной, неизменной характеристикой.
Так, многолетняя средняя температура в Санкт-Петербурге в первые десятилетия и столетие существования города была значительно ниже; она возрастает медленно, но с ускорением за последнее столетие вследствие как роста самого города и энергопотребления в нем, что повышает температуру воздуха, так и начавшегося и ускоряющегося общего потепления на Земле. Поэтому «типичность» любой средней величины - понятие относительное, ограниченное как в пространстве, так и во времени.
5.2. Средняя арифметическая величина
Понятие средней арифметической
Виды средних величин различаются прежде всего тем, какое свойство, какой параметр исходной варьирующей массы индивидуальных значений признака должен быть сохранен неизменным.
Средней арифметической величиной называется такое среднее значение признака, при вычислении которого общий объем признака в совокупности сохраняется неизменным.
Иначе можно сказать, что средняя арифметическая величина - среднее слагаемое. При ее вычислении общий объем признака мысленно распределяется поровну между всеми единицами совокупности. Например, средняя заработная плата или средний доход работников предприятия - это такая сумма денег, которая приходилась бы на каждого работника, если бы весь фонд оплаты труда (или все доходы, направленные на личное потребление) был распределен между работниками поровну.
Исходя из определения, формула средней арифметической величины имеет вид:
Средняя арифметическая
, (5.1)
где х̅ - средняя величина;
п – численность совокупности.
По формуле (5.1) вычисляются средние величины первичных (объемных) признаков, если известны индивидуальные значения признака. Если изучаемая совокупность велика, исходная информация чаще представляет собой ряд распределения или группировку, как, например, табл. 5.1.
Таблица 5.1
Распределение футбольных матчей высшей лиги России по числу забитых за матч обеими командами мячей в 1996 г.
Число забитых мячей, х | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | Итого |
Число матчей, fi | 30 | 56 | 71 | 59 | 49 | 24 | 12 | 3 | 0 | 2 | 306 |
Среднее число мячей, забитых за одну игру, должно представлять собой результат равномерного распределения общего числа забитых мячей по всем 306 матчам розыгрыша первенства. Общее число забитых мячей, согласно исходной информации табл. 5.1, можно получить как сумму произведений значений признака в каждой группе хi, на число игр с таким количеством забитых мячей fi (частоты). Получим формулу (5.2)
,
где п — число групп.
Такую форму средней арифметической величины называют взвешенной арифметической средней в отличие от простой средней, рассчитанной по формуле (5.1). В качестве весов выступают здесь числа единиц совокупности в разных группах. Название «вес» выражает тот факт, что разные значения признака имеют неодинаковую «важность» при расчете средней величины. «Важнее», весомее число забитых мячей, которое встречалось чаще: 1, 2, 3 мяча, а такие значения, как 7 или 9 забитых мячей, как бы ни радовались таким результативным матчам болельщики, при расчете средней не играют большой роли: их «вес» мал.
Имеем: х̅ = 802 : 306 = 2,62 мяча за игру.
Как видим, средняя арифметическая величина может быть дробным числом, если даже индивидуальные значения признака могут принимать только целые значения (дискретный признак). Ничего «предосудительного» для метода средних в этом не заключено; из сущности средней не вытекает, что она обязана быть реальным значением признака, которое могло бы встретиться у какой-либо единицы совокупности.
Виды средней арифметической
Если при группировке значения осредняемого признака заданы интервалами, то при расчете средней арифметической величины в качестве значения признака в группах принимают середины этих интервалов, т. е. исходят из гипотезы о равномерном распределении единиц совокупности по интервалу значений признака. Для открытых интервалов в первой и последней группе, если таковые есть, значения признака надо определить экспертным путем исходя из сущности, свойств признака и совокупности. Например, по табл. 5.2 можно минимальный возраст рабочих считать 17 лет. Тогда первый интервал будет от 17 до 20 лет, а максимальный возраст - 65 лет, тогда последний интервал - 50-65 лет.
Таблица 5.2
Распределение рабочих предприятия по возрасту
Группы рабочих по возрасту, лет | Число рабочих fj | Середина интервала х'j | xjfj |
До 20 | 48 | 18,5 | 888 |
20-30 | 120 | 25 | 3000 |
30-40 | 75 | 35 | 2625 |
40 - 50 | 62 | 45 | 2790 |
Старше 50 | 54 | 57,5 | 3105 |
Итого | 359 | 34,56 | 12408 |
Средний возраст рабочих, рассчитанный по формуле (5.2) с заменой точных значений признака в группах серединами интервалов, составил:

что и записано в итоговую строку по графе 3 табл. 5.2. Напомним, итог объемного показателя — это сумма, итогов по графе относительных показателей или средних групповых величин — средняя. Числитель дроби - это общая сумма человеко-лет, прожитых рабочими предприятия; разделив ее на число работников, получаем возраст в годах, так что логика показателя средней величины соблюдена.
Перейдем к рассмотрению средних вторичных (относительных) признаков. Сумма таких показателей сама по себе реальной величиной какого-либо признака в совокупности не является. Однако общее определение арифметической средней сохраняет силу и в этом случае. При вычислении таких средних величин необходимо, чтобы сохранялась сумма величины объемного признака, который является числителем при построении осредняемого относительного показателя. Например, при вычислении средней величины урожайности какой-либо сельскохозяйственной культуры (по формуле (5.2)) необходимо, чтобы общий объем валового сбора этой культуры остался неизменным при замене индивидуальных величин урожайности средней величиной. Нельзя менять реальную величину объемного признака - она является базой расчета средней. Чтобы выполнить указанное условие, в качестве весов при расчете средней величины относительного показателя необходимо принять значения того признака, который является знаменателем при определении относительного показателя. Так, при вычислении средней урожайности по совокупности хозяйств весами должны служить размеры площади данной культуры.
Рассмотрим пример расчета средней доли предметов народного потребления в общем выпуске промышленной продукции по совокупности предприятий (табл. 5.3). В этом случае весом должен являться общий объем всей продукции предприятия.
Тогда средняя доля предметов народного потребления в продукции четырех предприятий равна: х = (615,5: 2047) • 100% = 30,07%. Средняя доля ближе к долям у тех предприятий, которые имеют большой объем всей продукции (предприятия № 2 и 3). Числитель средней величины
- это объем выпуска предметов потребления всеми предприятиями - величина, которая должна сохраняться неизменной при замене разных четырех долей на среднюю долю. Расчет по данным табл. 5.3 проведен на основе известных индивидуальных значений осредняемого признака и весов.
Таблица 5.3
Объем и структура промышленной продукции
Номера предприятий | Объем всей продукции, млн руб., fj | Доля товаров народного потребления, % xj, | Объем выпуска товаров народного потребления, млн руб., xj fj |
1 ,5 2 ,0 3 1,8 4 ,2 | |||
Итого 2047 30,07 615,5 |
Однако исходная информация может иметь другую форму: индивидуальные значения осредняемого признака могут быть неизвестны, зато известны индивидуальные или суммарные значения объемных признаков как числителя, так и знаменателя относительной величины. Например, известно, что в акционерном сельхозпредприя-тии было посажено 145 га картофеля и собрано с них 2595,5 т продукции. При этом совершенно неизвестно, сколько было собрано с каждого гектара из 145 га в отдельности, хотя на самом деле, конечно, индивидуальные величины продукции, полученные на каждом гектаре, существовали объективно. Однако никакой потребности в их раздельном учете нет; учет продукции ведется по бригадам, по отдельным полям севооборота, но не по каждому гектару. Среднюю урожайность картофеля получают попросту делением массы собранной продукции на площадь посадки, т. е. как относительную величину, характеризующую хозяйство в целом:

По отношению к предприятию это относительный показатель. Но существуют и сами значения урожайности с каждого из 145 га, хотя и неучтенные. По отношению к ним 17,9 т с 1 га - это средняя величина. Такую форму определения средней арифметической величины, при которой остаются неизвестными индивидуальные значения осредняемого признака, следует называть Неявной формой средней. Формула такой средней имеет вид:

Свойства арифметической средней величины
Знание некоторых математических свойств средней арифметической полезно как при ее использовании, так и при ее расчете.
1. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю.
Доказательство:

Примечание. Для взвешенной средней сумма взвешенных отклонений равна нулю.
Попробуйте доказать это самостоятельно.
2. Если каждое индивидуальное значение признака умножить или разделить на постоянное число, то и средняя увеличится или уменьшится во столько же раз.
Доказательство:

Вследствие этого свойства индивидуальные значения признака можно сократить в с раз, произвести расчет средней и результат умножить на с.
3. Если к каждому индивидуальному значению признака прибавить или из каждого значения вычесть постоянное число, то средняя величина возрастет или уменьшится на это же число.
Доказательство:

Это свойство полезно использовать при расчете средней величи-ны из многозначных и слабоварьирующих значений признака, например роста группы лиц: х1 = 179 см; х2 = 183 см; х3= 171 см; х4 = 180 см; х 5= 169 см. Для вычисления среднего роста из каждого значения вычитаем 170 см и находим среднюю из остатков:
(9+ 13 + 1 +: 5 = 6,4. Средний рост = 6,4 + 170 = 176,4 см.
4. Если веса средней взвешенной умножить или разделить на постоянное число, средняя величина не изменится.
Доказательство:

Используя это свойство, при расчетах следует сокращать веса на их общий сомножитель либо выражать многозначные числа весов в более крупных единицах измерения.
В табл. 5.4 приведен пример комплексного использования свойств средней арифметической для облегчения расчетов.
Таблица 5.4
Расчет средней продуктивности коров на ферме
Группы коров по надою за год, кг хj | Число Коров fj | Середина интервала, кг, x’j |
|
|
3000 – 3- 344 30 3800-4 4200-46 40 | ||||
Итого |
83
Средний надой молока на корову находим так:

5. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа.
Доказательство. Составим сумму квадратов отклонений от переменной а:

Чтобы найти экстремум этой функции, нужно ее производную по а приравнять нулю:
![]()
Отсюда имеем:

Таким образом, экстремум суммы квадратов отклонений достигается при а = х. Так как логически ясно, что максимума функция не может иметь, этот экстремум является минимумом.
Применение простой и взвешенной средней
Простая и взвешенная средние величины различаются не только по величине (не всегда), по способу вычисления, но и по своей роли в решении различных задач статистического анализа. Рассмотрим, например, среднюю величину урожайности картофеля в группе хозяйств. Если эта средняя при решении поставленной задачи входит в систему показателей площади посадки, валового сбора, себестоимости, суммы затрат и других характеристик производства, то следует применять взвешенную среднюю, так как произведение невзвешенной средней на общую сумму площадей не даст суммы валового сбора.
Если же нас интересуют такие задачи, как измерение вариации урожайности между хозяйствами или связь урожайности с дозой органических удобрений, то следует применять простую среднюю величину урожайности, полностью абстрагируясь от размеров площадей посадки. Иначе на полученный результат повлияют различия площадей, совершенно не касающиеся этого признака. Точно так же, если необходимо изучить колебания урожайности за ряд лет и выявить их связь с температурой июня и суммой осадков за лето, нужно применять простую среднюю урожайность за ряд лет, абстрагируясь от различия размеров площадей в разные годы.
Чтобы правильно применять средние величины, следует знать, от каких причин зависит различие между простой и взвешенной средними. Рассмотрим этот вопрос на примере арифметической средней. Пусть x̅ - простая средняя, х̅z - взвешенная средняя, в которой весами выступают значения признака z, п - число единиц совокупности. Отклонения индивидуальных значений признака хi от простой средней х̅ обозначим ∆xi = хi - х̅. Отклонения признака веса ∆zi = zi -z̅. Тогда индивидуальные значения признаков х и z можно выразить через их средние и отклонения: хi = х̅ + ∆xi; zi = z̅ + ∆zi, а взвешенную среднюю х, представить в виде

Перемножим величины в скобках и просуммируем почленно, имея в виду, что
. Средние величины можно вынести за знак суммирования, как константы. Получим:

Так как суммы отклонений индивидуальных значений признака от средней арифметической согласно первому ее свойству равны нулю, то второе и третье слагаемые числителя также равны нулю.
Остается:

Числитель второго слагаемого в формуле (5.4) - это числитель коэффициента корреляции между осредняемым и весовым признаками (см. формулы 8.11 и 8.14). Подставив выражение коэффициента корреляции /^ в (5.4), получим:

Итак, средняя арифметическая взвешенная равна простой средней плюс произведение среднего квадратического отклонения ос-редняемого признака на коэффициент вариации весового признака и на коэффициент корреляции между этими признаками. Если обе части равенства (5.5) разделить на простую среднюю х, получим:

(О среднем квадратическом отклонении и коэффициенте вариации см. ниже в этой главе.)
Из (5.5) следует, что взвешенная средняя равна простой в трех случаях:
• а) если не варьирует изучаемый признак, σх = 0 - тривиальная ситуация, когда и сами средние не нужны;
• б) при условии, что не варьирует признак-вес vz = 0;
• в) в случаях, когда между осредняемым и признаком-весом нет линейной корреляции, rxz = 0.
Взвешенная средняя больше простой, если эта корреляция прямая. Взвешенная средняя меньше простой средней, если эта корреляция обратная.
5.3. Другие формы срдних величин
Средняя квадратическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратической средней величиной (х^). Ее формула такова:

Например, имеются три участка земельной площади со сторонами квадрата: х1 = 100 м; х2 = 200 м; х3 =300 м. Заменяя разные значения длины сторон на среднюю, мы, очевидно, должны исходить из сохранения общей площади всех участков. Арифметическая средняя величина (100+ 200 + 300) : 3 =200 м не удовлетворяет этому условию, так как общая площадь трех участков со стороной 200 м была бы равна: 3∙(200 м)2 = м2. В то же время площадь исходных трех участков равна: (100 м)2 + (200 м) + (300 м)2 = м. Правильный ответ дает квадратическая средняя:

Во второй части главы будет показано, что главной сферой применения квадратической средней в силу пятого свойства средней арифметической величины является измерение вариации признака в совокупности.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 |




