Лабораторная работа №6. Анализ динамических рядов
Основные понятия
При исследовании многих природных и производственных процессов возникает задача анализа в динамике событий и их последовательностей, которые не поддаются методам стандартного математического анализа, поскольку зависят от случайных факторов. Основными задачами в таких исследованиях являются детальное изучение этих процессов, выделение их существенных характеристик, которое может привести к возможности прогнозирования развития этих процессов в будущем. Также представляет интерес выделение внутренних закономерностей, которым подчинено развитие этих процессов.
Временной ряд (динамический ряд, ряд динамики) – это последовательно измеренные через некоторые промежутки времени данные о значении какого-либо параметра исследуемого процесса (или нескольких параметров, в этом случае говорят о многомерном временном ряде).
Временной ряд состоит из двух элементов:
- периода времени, за который или по состоянию на который приводятся числовые значения;
- числовых значений показателя, называемых уровнями ряда.
Временные ряды бывают детерминированными (получены на основе значений некоторой неслучайной функции, например, ряд последовательных данных о количестве дней в месяцах) и случайными (результат реализации некоторой случайной величины).
Классификация временных рядов проводится по следующим признакам.
• По характеру показателя, для которого определяются уровни:
- детерминированные ряды, которые получены на основе значений некоторой неслучайной функции, например, ряд последовательных данных о количестве дней в месяцах;
- случайные ряды, представляющие собой реализацию некоторой случайной величины.
• По форме представления уровней:
- ряды абсолютных величин;
- ряды относительных величин;
- ряды средних величин.
• По характеру временного показателя:
- моментные ряды, в которых уровни характеризуют значение показателя по состоянию на определенные моменты времени;
- интервальные ряды, уровни которых характеризуют значение показателя за определенные периоды времени. Важная особенность интервальных временных рядов абсолютных величин заключается в возможности суммирования их уровней.
• По расстоянию между датами и интервалами времени:
- полные или равноотстоящие ряды, если даты регистрации или окончания периодов следуют друг за другом с равными интервалами;
- неполные или неравноотстоящие ряды, если принцип равных интервалов не соблюдается или имеются пропущенные значения.
При изучении рядов динамики обычно решают следующие задачи:
1. Вычислить числовые и функциональные характеристики ряда (описательные методы).
2. Определить, имеется ли некоторая неслучайная, закономерная компонента, описывающая тенденцию (тренд) процесса.
3. Определить, нет ли регулярных, колебательных “сезонных” компонент, которые связаны с периодическими естественными колебаниями параметров случайного процесса.
4. Выделить и описать основные колебания случайного процесса вокруг тренда, в случае необходимости удалить влияние второстепенных факторов.
5. Дать прогноз развития случайной процесса на ближайшее будущее и указать степень уверенности в этом прогнозе.
Следует иметь в виду, что при изучении рядов динамики необходимо соблюдение ряда условий:
• Статистические данные должны быть сопоставимы по территории, кругу охватываемых объектов, единицам измерения, времени регистрации, ценам, методологии расчета. Сопоставимость по территории означает, что данные по странам и регионам, границы которых изменились, должны быть пересчитаны в старых пределах. Сопоставимость по кругу охватываемых объектов означает сравнение совокупностей с равным числом элементов. Сопоставимость обеспечивается так называемым смыканием рядов динамики. При этом абсолютные уровни могут заменяться относительными, иногда делают пересчет в условные абсолютные уровни и т. п.
• Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней (неполных динамических рядов), если же такие пропуски неизбежны, то их восполняют условными расчетными значениями.
• Временные ряды применяются только для краткосрочного прогнозирования (чаще всего на 1 период вперед).
• Для анализа и прогноза необходима достоверная информация о развитии исследуемого явления минимум за пять периодов.
Числовые характеристики динамических рядов
• Интенсивность изменений уровней ряда во времени характеризуют аналитические показатели. Различают базисные (изменение относительно начального уровня ряда) и цепные (изменение относительно предыдущего уровня) показатели:
Табл.6.1. Аналитические показатели ряда динамики
показатель | базисный | цепной |
Абсолютный прирост Di |
|
|
Коэффициент роста Кр |
|
|
Темп роста Тр |
|
|
Коэффициент прироста Кпр |
|
|
Темп прироста Тпр |
|
|
Абсолютное значение одного процента прироста А |
|
|
• Ряд динамики в целом характеризуют средние показатели:
Средний уровень ряда:
- для полного интервального ряда абсолютных величин:
;
- для полного интервального ряда относительных и средних величин средний уровень должен определяться с учетом информации, связанной с осредняемым:
, если
- соответствующая абсолютная величина;
- для моментного динамического ряда:
;
в частности, для полного моментного ряда:
.
Средний абсолютный прирост:
.
Средний коэффициент (темп) роста:
.
Средний коэффициент (темп) прироста:
,
.
Пример 6.1. Имеются данные о числе пожаров (тыс. случаев) в России в 1974-1988 гг. Вычислить характеристики динамического ряда.
Год | Число пожаров | Год | Число пожаров | Год | Число пожаров |
1974 | 18,9 | 1981 | 20 | 1988 | 19,3 |
1975 | 22,8 | 1982 | 16 | 1989 | 22,8 |
1976 | 15,1 | 1983 | 12 | 1990 | 18,2 |
1977 | 17 | 1984 | 15 | 1991 | 17 |
1978 | 12,1 | 1985 | 12 | 1992 | 23,3 |
1979 | 14,3 | 1986 | 16,1 | 1993 | 18,2 |
1980 | 15,1 | 1987 | 13,5 | 1994 | 20,1 |
Решение. Прежде всего классифицируем данный динамический ряд: это полный интервальный ряд абсолютных величин.
Перенесем данные в Еxcel, расположив их в два столбца. Добавим также столбец «№ периода», начиная с 0.
Для аналитических показателей подготовим две таблицы – для базисных и цепных показателей, по периодам начиная с 1, и вычислим соответствующие показатели в таблице по формулам в таблице 6.1, результат будет выглядеть так:

Вычислим теперь средние показатели.
Поскольку мы имеем дело с полным интервальным рядом абсолютных величин, средний уровень ряда вычисляем по самой простой формуле среднего арифметического уровней, используя функцию СРЗНАЧ:
=СРЗНАЧ(B2:B22)
Средний абсолютный прирост также вычислить просто:
=D22/20
Для вычисления среднего коэффициента роста воспользуемся функцией ПРОИЗВЕД, а для извлечения корня применим возведение в степень 1/n:\
=ПРОИЗВЕД(E3:E22)^(1/20)

Анализ тренда динамического ряда
Перейдем теперь к задачам собственно анализа временного ряда и прогнозирования.
В общем виде временной ряд представляют, в зависимости от задачи, в виде аддитивной (6.1) или мультипликативной (6.2) модели, на основании которой дается прогноз:
(6.1)
(6.2)
где
- детерминированная составляющая,
- стохастическая (случайная) составляющая.
В детерминированную составляющую могут входить три элемента:
- эволюционная составляющая - характеризует основную тенденцию развития исследуемого объекта (тренд)
- сезонная составляющая - показывает колебания показателя в течение года.
- циклическая составляющая - формируется под воздействием долговременных циклических факторов
Стохастическая составляющая формируется под воздействием большого числа случайных факторов, не отражаемых в прогнозной модели.
Выделение тренда может быть произведено тремя методами:
1. Укрупнение интервалов. Ряд динамики разделяют на некоторое достаточно большое число равных интервалов. Если средние уровни по интервалам не позволяют увидеть тенденцию развития явления, переходят к расчету уровней за большие промежутки времени, увеличивая длину каждого интервала (одновременно уменьшается количество интервалов).
2. Метод скользящей средней. В этом методе исходные уровни ряда заменяются средними величинами, которые получают из данного уровня и нескольких симметрично его окружающих. Целое число уровней, по которым рассчитывается среднее значение, называют интервалом (окном) сглаживания. Интервал может быть нечетным (3, 5, 7 и т. д. точек) или четным (2, 4, 6 и т. д. точек).
При нечетном сглаживании полученное среднее арифметическое значение закрепляют за серединой расчетного интервала.
При четном сглаживании:
- определяют нецентрированные скользящие средние по четному числу уровней,
- вычисляют центрированные скользящие средние как смежные парные средние нецентрированных скользящих средних и относят их к соответствующим периодам или моментам времени.
3. Аналитическое выравнивание. Под этим понимают построение уравнения регрессии
.
Вид уравнения регрессии выбирают так, чтобы оно давало содержательное объяснение изучаемого процесса; основываясь на характере изменения цепных темпов роста, чаще всего выбирают линейную, параболическую, экспоненциальную зависимость или линеаризуемые функции (полулогарифмическую, степенную, гиперболы). Следует помнить, что для достаточной надежности уравнения тренда, как правило, на каждый параметр должно иметься 6-7 моментов или интервалов. Но анализ длинных рядов динамики не всегда возможен, поскольку основная тенденция ряда могла изменяться из-за каких-то внешних причин. Поэтому предпочтение отдается функциям с малым числом параметров
Методы выравнивания можно комбинировать, например, построив уравнение регрессии по уровням, сглаженным методом скользящей средней. Обычно это делают для выявления сезонности, выбирая окно сглаживания равным периоду предполагаемой сезонности (например, год для выявления внутригодичной сезонности).
При аналитическом выравнивании обычно данные временные моменты (например, годы) заменяют на условные моменты времени (например, 1,2,… или 0,1,2…). Кроме того, для простоты вычислений часто условные моменты выбирают так, чтобы их сумма была равна 0 (например, -5,-4,-3,-2,-1,0,1,2,3,4,5)
В Excel аналитическое выделение тренда осуществляется теми же методами, что и построение уравнения регрессии в корреляционно-регрессионном анализе.
Выбор наилучшего уравнения тренда осуществляется по следующим критериям:
• Чем больше значение коэффициента детерминации R2, тем точнее уравнение тренда описывает вариацию уровней динамического ряда. Влияние случайного фактора оценивается как (1-R2)
• Чем больше величина F-критерия, тем предпочтительнее данное уравнение тренда. Если значение F-критерия меньше критического, то уравнение не пригодно для описания тренда и прогнозирования
• Существует (и реализовано в различных статистических пакетах) множество методик анализа остатков
на случайность. Неслучайность остатков означает либо что выбрано неподходящее уравнение тренда, либо что ряд имеет периодичности, которые затем выявляют специальными методами анализа.
Один из способов визуальной проверки качества уравнения регрессии заключается в анализе графиков остатков.
Другой способ предоставляет критерий Дарбина-Уотсона DW, позволяющий оценить автокорреляцию остатков:

.
При заданном уровне значимости, числе уровней динамического ряда и числе параметров при t в уравнении тренда находят табличные критические значения критерия.
Если ral>0 , то при DW<DW1 есть автокорреляция остатков, уравнение не пригодно для описания тренда; при DW>DW2 нет автокорреляции остатков, уравнение можно использовать.
Если ral<0, то с критическими сравнивают значения 4-DW.
Составление прогноза на основе тренда
Если построено значимое уравнение тренда
, то точечный прогноз на следующий период вычисляется по этому уравнению:
.
Доверительный интервал для прогноза имеет вид:
,
где t(a) – коэффициент доверия, определяемый из таблицы распределения Стьюдента (в Excel – при помощи функции СТЬЮДРАСПОБР) для заданного уровня значимости a и числа степеней свободы k2=n-m (n+1 – число уровней ряда, m - число параметров уравнения тренда без свободного члена; значение k2 выводится в статистике функции ЛИНЕЙН);
- стандартная ошибка значения y, характеризующая колеблемость уровней относительно тренда; это значение выводится в статистике функции ЛИНЕЙН.
Q – поправочный коэффициент, зависящий от типа уравнения тренда, периода упреждения и типа прогноза (индивидуальное значение или среднее).
В частности, при линейном или линеаризуемом тренде для индивидуального прогноза
, для прогнозирования среднего значения
.
Выявление сезонной неравномерности
Сезонные колебания - регулярно повторяющиеся подъемы и снижения уровней динамического ряда внутри года в течение ряда лет. Сезонность может проявляться как к квартальным и месячным, так и к недельным и дневным и даже часовым данным.
Существуют две модели сезонности:
- в аддитивной модели сезонность выражается в виде абсолютной величины, которая добавляется или вычитается из среднего значения ряда для учета сезонности;
- в мультипликативной модели сезонность выражается как процент от среднего уровня, на который умножается среднее значение для учета сезонности при прогнозировании.
Для выявления сезонной неравномерности необходимы данные за несколько (не менее трех) лет (или, в зависимости от типа сезонности, – месяцев, недель, дней).
Тренд определяют после сглаживания данных методом скользящих средних с целью погашения сезонности, для чего выбирается интервал сглаживания, равный году (для внутригодичной сезонности); получают
- сглаженные уровни.
Сезонность можно измерять в виде:
- абсолютной величины
;
- коэффициента сезонности
.
Для одноименных периодов рассчитывают средние показатели сезонности и вводят поправочный коэффициент так, чтобы
(k – число сезонов).
Пример 6.2. Проанализировать динамику числа пожаров (табл. 6.1)
Решение. Перенесем данные на новый лист Excel, добавив в столбце С номера периодов t, начиная с 0.
Проведем визуальный анализ: построим график по данным уровней (диапазон В2:В22). Добавим линию тренда, выбрав опцию «показать на диаграмме величину R^2»; эта величина мала (равна 0,0678), значит линейный тренд нельзя использовать. Добавим линию полиномиального тренда степени 2, также поместив на диаграмму величину R^2; она равна уже 0,336. Построим уравнение этого тренда. Для этого в столбце D вычислим квадраты номеров периодов (в ячейке D2 вводим =С2^2 и копируем вниз). Теперь выделим диапазон В42:D46 и введем в строке формул
=ЛИНЕЙН(B2:B22;C2:D22;1;1)
завершив ввод нажатием ctrl+shift+enter.
Для проверки значимости уравнения вычислим критическое значение F-критерия, введя в ячейке Е45 формулу
=FРАСПОБР(0,05;20-C45;C45).
Поскольку значение F-критерия в ячейке В45 больше критического, следует заключить, что уравнение тренда значимо. Но первый коэффициент в этом уравнении мал (всего 0,054), поэтому проверим его на значимость при помощи критерия Стьюдента. Значение критерия вычислим в ячейке F43:
=B42/B43,
критическое значение – в ячейке G43:
=СТЬЮДРАСПОБР(0,05;C45)
Вычисленное значение (2,7) больше критического (2,1), значит коэффициент значим.

Таким образом, уравнение тренда:
.
Проверим теперь остатки динамического ряда на случайность. Для этого вычислим теоретические значения уровней на основании уравнения тренда, введя в ячейке Е2
=B$42*D2+C$42*C2+D$42
и скопировав результат вниз до ячейки Е22.
Теперь вычислим остатки li, вычтя из реальных уровней теоретические, и значение коэффициента автокорреляции ral в ячейке Н2:
=СУММПРОИЗВ(F3:F22;F2:F21)/СУММКВ(F2:F22)
Далее, поскольку полученное значение коэффициента автокорреляции отрицательно, вычисляем значение 4-DW в ячейке I2:

Критические значения критерия Дарбина-Уотсона находим в таблице (см. приложения) для числа наблюдений n=20 и числа параметров уравнения тренда m=2: DW1=1,1 и DW2=1,54. Таким образом, 4-DW<DW2, значит, автокорреляции остатков нет, в том числе нет и сезонных колебаний, и уравнение пригодно для прогнозирования.
Вычислим точечный прогноз на 1995 год, добавив к таблице вычислений период 21 в строке 23; в ячейке Е23 получаем прогнозное значение:

Для составления интервального прогноза при уровне значимости a=0,05 вычислим коэффициент доверия t(a) в ячейке I23:
=СТЬЮДРАСПОБР(H23;C45)
Для вычисления поправочного коэффициента Q воспользуемся формулой для линейного тренда (для упрощения вычислений). Для этого предварительно в столбце G вычислим значения t-n/2 (учитывая что n=20). Далее в ячейке J23 вводим формулу:
=КОРЕНЬ(1+1/21+(21-10)^2/СУММКВ(G2:G22)).
Интервал прогноза в ячейке К23:

Таким образом, интервальный прогноз числа пожаров на 1995 год при уровне значимости 0,05 составляет 23,25±6,9 тыс.






